StreeTalk,給你一個感觀世界(轉自個人文章)
1 背景
這個項目來自於去年上海市經信委主辦的城市開放數據競賽的一個作品,和其他項目不同的是,這個project沒有採用官方提供的開放數據而僅僅由三人完成。雖然這項工作還不完整,距離推向市場的產品仍有一定的距離,但我們依然很喜歡這一產品,所以今天將他在這裡做一個簡單介紹,希望大家喜歡。我們三人的微型團隊收穫十強,並見諸包括新華網、人民網等各主流媒體。
2 基本理念
整個idea的源自於一個很小的故事:兩個月前我約了朋友去吃飯。因為剛搬家不久,對於周圍的環境不是很熟悉,於是機緣巧合的使用了高德的步行導航,搜索去近鐵廣場的步行路線。驚訝的是,我發現它給我導了一條非常陰森恐怖的道路。整條路上人行道破敗不堪,沒有路燈,且更沒有沿街的店鋪。事後我才知道這條路的圍牆背後竟是一個在拆遷的棚戶區。當我膽戰心驚地回到家裡,始終在想著同一個問題。「為什麼要給我導這麼一條路?」 (關於這段糟糕的夜行路,我還拍了一段視頻,可以點擊這裡觀看,不過相當無聊)
其實答案也很簡單,僅僅因為「時間」兩個字。沒錯,這條路確實是走到目的地最快的路,可事實上這麼陰森的路被導航儀推薦出來有種毛骨悚然的錯愕。換做一名女生來走,估計情況會變得更糟糕吧。
3 研究方法
那麼又一個問題來了,除了時間,可不可以用別的標準來衡量?譬如在這件事中,我更在意的是街道的「安全感」。可是安全感該怎麼去衡量和計算呢?大家請看這樣的兩幅圖:相信如果可以選擇的話,多數的人寧可繞路也不願意走左邊這條路。因為它看起來實在是太不安全了。
其實把街道照片兩兩比較是一種很好的方法。MIT的Media Lab在幾年前就採用了同樣的思路來統計人們對於街道的安全感。他們也是每次給兩張照片,詢問被訪問者哪張看起來更安全。當他們積累了120多萬次的點擊之後,通過計算,每張被比較的照片都可以處理為0-10的安全感評分。
可又一個問題來了,即使可以用同樣的方法來為我們國內的街景照片像這樣找人來打分計算。但當面對數千萬的城市街道圖像的時候,這分可怎麼打得完?這時候就需要人工智慧了,為了克服這問題,我們採用了深度學習的技術,讓計算機從已打過分的每張照片中抽取深度圖像特徵。
然後再通過多任務學習的方法,我們給上海市230多萬張城市街景照片進行了分類。這裡我們選取一些打分的結果給大家看,區別還是挺明顯的。同樣以10分為滿分,高安全感得分的街景照片,多數有著豐富的綠化、 乾淨整潔的馬路,而低 安全感評分的街景照片中,我們則看到了各種髒亂差的環境,沒有公共設施、沒有人煙,甚至很難想像這裡是上海。
4 應用案例
更進一步,我們希望這些計算結果為人們的出行提供幫助 。所以我們做了一個安全感評分地圖,具體見如下的Demo。我們將這些打分移植到了路線規划上,當人們在選擇出行的時候,系統將自動計算沿線每段道路的安全感平均分。譬如以決賽場地現在所在的市北工業園為例,如果我們打算步行去大寧公園,從距離上看確實還不錯,不過這個安全感評分有些路段似乎並不是特別理想,我們可以點擊具體路段查詢周邊的街景照片,可以看出確實上面這段的街景照片和下面的給人感覺有一定的差別。話說還記得我之前說的我家那條破路么,它的安全感得分只有4分。
【城室科技】StreeTalk_Demo1—在線播放—優酷網,視頻高清在線觀看視頻不僅如此,接下來我們的關注點還將從整體感知進一步轉移到物體感知。就好比將這張照片分解為各個有意義的原素,比如不同的車類,標示、人、植被等等。因為如果能知道街景照片中,具體哪些要素在影響著人的感知的話,那麼就能為城市研究、城市規劃提供決策支撐。
同樣的方法也可以用在安全感上,我們挑選高分和低分的兩組照片,讓計算機標出來他認為哪部分更起作用。
我們發現在高分區的照片更多的高亮了綠化、人、店鋪、書報亭、甚至開闊的馬路等等,還挺有意義的。而低分區呢則清一色地明顯框出了各種髒亂差集中的地方。
這第二個Demo將展示我們要素識別的更高級的技術 。第一種稱為物體檢測識別,我們可以在視頻中標出高達80多種的要素,囊括了小汽車、卡車、公交車、自行車、行人、路燈、甚至花壇等等,而第二種技術稱為場景語義分割,該技術則精確到了像素級的劃分,可以把道路、天空、建築等完全切割區別開來。
【城室科技】StreeTalk_Demo2—在線播放—優酷網,視頻高清在線觀看視頻各位朋友如果有興趣嘗試我們的StreeTalk產品,可以發郵件給我們:liuliu@citorytech.com
最後再附上一個我們當時的團隊介紹視頻,委託一位視頻剪輯編導所做,很帶感:
【城室科技】StreeTalk_團隊介紹—在線播放—優酷網,視頻高清在線觀看視頻以上就是這次決賽介紹的主要一個產品,另一個關於街邊攤的工作下次另文介紹。有興趣的朋友也可以在這裡觀看:StreeTalk 項目 - 城室
推薦閱讀: