你認為只有企業才會面臨大數據問題嗎?想一下紐約市:這個美國最大的城市擁有820萬人口,每天產生大量的數據,其中大部分數據位于很多市政機構和部門的高度分散的孤島中。
這些數據涉及商業識別碼(BIN)、BBL稅號、營業執照、違規停車罰單、交通違法行為、健康檢查、犯罪行為、救護服務召喚、火災等。
紐約市市長辦公室政策和戰略規劃分析主管兼紐約金融犯罪特遣部隊主管Michael Flowers表示:“我們每天需要處理各種數據:郵寄地址、稅號、建筑標識號等等,但當我們試圖利用所有這些數據時,從本體論和分類學的角度來看,這變得非常困難。此外,所有這些數據都被存儲在城市的不同位置,可以說是支離破碎。存儲系統本身也存在巨大差異,有些系統很先進且易于使用,而有些系統則早已過時。”
紐約市的311熱線每天接收超過65000次呼叫
讓事情更具挑戰性的是,紐約市的311非緊急熱線每天接收超過65000次呼叫,其中涉及對噪音的投訴以及對破爛和坑坑洼洼的人行道的報告,還有詢問如何獲取契據或者養食人魚是否合法。
“我們只是基于簡單的先后順序來分配我們的資源,”Flowers表示,“有電話打進來,我們就會對這個電話做出響應。”
唯一的問題是:但是311的呼叫情況并不能說明這些資源的真正去向,它們是數據,但是不完整的數據。
于是,Flowers對紐約市進行了臭鼬項目(用來形容高度靈活、高度自治、不受約束的項目),他和他的團隊需要向紐約市政府社區展示紐約的大量數據如何可以用來更有效地分配資源。
“我們正在努力使你們的生活更加輕松,同時盡可能地有效地分配這些資源,這樣你們就不需要想過去一樣付太高的稅額,”Flowers表示,“我們需要做的是想辦法展示一個共用平臺的效用。我需要向紐約政府社區證明我們能夠整合和利用這些信息,這是我們的工作。”
大數據和非法改建
這個項目“雄心勃勃”,Flowers想要利用這些數據來幫助識別可能存在非法改建的建筑物,例如,原本只能容納六個人的建筑物居住了60個人。
根據對311熱線的投訴,你會認為大部分非法改建發生在曼哈頓下城。但實際上,我們發現非法改建出現在布魯克林、皇后區和布朗克斯各區的外圍。
Flowers表示:“在2011年春天和夏天,我們有兩棟非法改建的建筑物發生火災,一些消防員受重傷,還有一些人死亡。”
Flowers稱,非法改建的建筑物更容易發生火災,更重要的是,在這些建筑物中,消防員更容易受傷或者死亡,因為這些建筑物的逃生出口往往被阻塞。“我們的任務就是想辦法解決這個問題。”
成功的數據項目從與人們溝通開始
對于Flowers的團隊來說,這似乎是不可能完成的目標。他的團隊都沒有很高的學歷,并且都在25歲或者以下。此外,因為這是一個臭鼬項目,很少人明白他們在做什么。但他們下決心改變局面。Flowers做的第一件事情就是與第一線的人們交談。
他表示:“我跟消防員談,跟警察談,跟屋宇署的督察談,我問他們:‘當你們看到一個不安全的建筑,你們看到了什么?’然后我將這些用數據來體現。”
Flowers讓其團隊研究實際“騰出”情況,即當檢察院發現建筑物不安全時,他們會要求騰空整個或者部分建筑物。
“我不需要解構人們的投訴,”Flowers表示,“而是解構問題,我使用城市數據來解構問題。”
Flowers的團隊找出了幾個可行的指標,包括以下:
-- 這個建筑物是否位于“高風險地區”,即較貧窮的市民更可能居住的危險的地區?
-- 這是1938年以前的建筑物嗎?1938年建筑規范有所改變,在規范改變后的建筑往往更加安全。
-- 建筑物是否已經喪失抵押品贖回權或者稅收留置權?“這兩個問題的答案很重要,這表明業主的財務狀況,”Flowers表示,“我并不是說當業主破產后,他們會向對待垃圾一樣對待他們的房屋。”
--是否有過投訴?Flowers表示:“如果此前有過投訴,六個月后又有投訴,那么這個建筑物很有可能會發生火災。”
通過這些正確的數據,Flowers的團隊創建了一個工具,可供檢察員直接使用。在檢察員使用該工具前,當他們發現建筑物不安全時,他們不得不騰空13%的建筑,而在Flowers項目的18個月后,檢察員現在可以騰出70%的建筑物。
“我們取得成功的原因在于我們使用了正確的數據,”Flowers表示,“這個城市的數據是好的,我們采用了正確的方式來使用這些數據。”
“我們所做的就是分清輕重緩急,”他補充說,“這是需要立即采取行動的情報信息。”
隨著受數據驅動的決策的價值得到證明,Flowers表示在現任市長2014年1月離任之前,他還有三個目標:
-- 建立全市范圍內的分析,主要集中在更有效地利用機構資源
-- 發展和啟動基于數據的資源分配文化
-- 將動態紐約市數據推向公眾、技術/創業界和學術界