北京焦灼?上海頹廢?看大數據如何解讀城市性格

城市如人,在形成的過程中也會顯現出獨特的性格。具有特殊文化品格和精神氣質的城市,無疑是最具吸引力而叫人難忘的。但你是否想過,如何用大數據深度探尋一個城市專屬的性格特色,了解城市心理?在1月4日的數據俠線上實驗室,DT君邀請到城市象限的地產業務總監張希煜,她通過挖掘分析歌詞、豆瓣、點評等多維數據,對城市性格特徵進行輪廓側寫,有趣生動地為我們講述了如何用大數據解密城市性格。

何謂城市性格?

今天我分享的主題是城市性格,也許大家會覺得城市性格是一個複雜且充滿神秘的話題。首先,我將從人的性格研究開始講。因為這是所有科學研究當中最為通俗化的內容,任何一個人有可能不知道某個專業領域的研究,但他一定知道關於人的性格科學或偽科學的研究,比如大家接觸到最多的星座、血型、八字的研究。

我把人的性格研究劃分成了成因研究和表現研究兩個部分。

從成因研究上來看,這三個類型對城市性格研究有較大的借鑒意義,可以借鑒到分析城市性格的類型化研究中去。

一是星座、血型、八字類的迷幻研究,它的一大特點是會充分摺疊一切可以觀測的現象,能在摺疊中尋找出凸顯話題性的方式,從而訊速博取大家的關注,形成共鳴。這可以對應到文人作家是如何描述城市特點的,他們會提取一些非常抽象的內容,以一種比較具有感染力但不全面的方式去表達,從而形成對一個城市的簡單感性的描述。

二是神經生理觀能類的降維研究,人的性格和腦功能、生理結構、神經系統有很大的關係,這類研究是把高度複雜、多維的結構還原到較單純的物理基礎內容,從而去探究它的成因和表現的過程。對應到城市研究,就像是通過城市空間有形可見的物理功能性元素,去探究城市性格的表現。

三是生活史社會影響類的溯源研究,主要針對如何挖掘過去的事情,包括環境變化是如何影響性格形成的。這可以對應到我們對城市文化溯源、發展歷程的研究中。

個體間的區別促生個性,對城市來講也是這樣——由於氣候、歷史、建築、習俗、方言、食性等等諸多不同,城市才會有血肉有靈魂,謂之「城市性格」。研究一個城市的城市性格,不可避免地要去做一個全面的分解。

我們認為城市性格是從物理到心理的。

其中城市空間是我們所在城市性格展示的空間載體,包括了建築元素和交通元素;城市場景由我們的交互過程、認知、情感、行為建構;另一方面,我們也是城市個體化的成員,集聚成群體化的方式去呈現城市性格,我個人認為城市成員是城市性格最為核心的內容。

所以綜上所述,城市性格是一種城市特性的集合,是在城市空間和城市場景的影響之下,城市成員所表現出來的特點和特徵。

城市性格與大數據間的碰撞融合

類比人的性格,我們通過行為情感和認知反映關注城市性格特質,而大數據是作為城市性格的素材。

這個素材主要是三個層面:

一是社交網路類的信息網站上提供的廣泛文本信息,它和我們一般接觸到的純數據最大的區別是,文本信息是一種信息量大且摺疊程度高的信息,其中的分析內容有很大的空間可以去主觀操作、創作。

二是社交網路類網站提供的對某一個信息傳播方式及傳播範圍的指向性數據,這為我們提供了觀測每一個貢獻信息的人之間關係的方式。我們可以通過這些用戶是否對同一件事情發表評論、是否參與同一個活動、是否分享了類似的內容等途徑去構建用戶之間的關係。

三是對象關係,主要是通過挖掘用戶與用戶之間、參與者與參與者之間的內在聯繫,比如通過豆瓣同城,可以將關注同一類或同一個活動的用戶建立成一個群組,這樣他們就有了一個維度上聯繫。

在基於種種途徑去挖掘城市性格時,實際上是在建立一個更為豐滿的城市感知。

通過和其他傳統城市感知方式來對比,當我們去試圖建立城市性格時,實際上是在挖掘一個城市發展的內部動機。那麼它的源頭是什麼?這是一個很好的視角,因為如果去對比一些傳統的研究方式,大家很容易發現如果僅僅是以建立因果聯繫就去做發展預判,會導致對城市的預測是扁平的。

焦灼的北京 VS 頹廢的上海

談到各個城市的性格,很多人會第一時間想到上海與北京。它們是近代以來中國的兩個最大的都市,一南一北,互為「他者」,無論是城市形態、社會分層,還是城市景觀、文化風格,都呈現出鮮明的對比。

對北京和上海的比較,永遠是大家樂此不疲的話題。那麼對生活在這兩個城市的人來說,他們所懷的城市情感是怎樣的呢?

為了找到答案,我們團隊在去年5月做了一個研究:通過挖掘北京和上海歌詞文本信息探測其城市情感,我從中節選了一些研究結果展示。

我們提取了「離開」和「留下」兩個對立性的詞語作為指向詞,用以評估兩座城市,大家通過詞頻可以明顯看到,相比於上海,北京是一座在離開和留下之間非常糾結掙扎的城市。

這張圖是類比語言學研究方式後建立的詞庫:

我們通過詞庫來對比兩座城市詞性的相似和異同,最後建立了一個形容詞列表。從中我們發現北京會有更多積極的詞語,描述感情更為激烈,色彩更為明確;而上海會更多地使用一些私人化的辭彙,表現更多的是朦朧的情感。

另外關於歌詞,我們建立了一個詞與詞之間聯繫的主成員分析圖表,具體如下圖:

我們團隊也在試圖去建立一個基於文化地圖之上的城市詞頻地圖,希望能夠挖掘到更為廣泛的語料信息,通過詞與詞之間的關聯,挖掘城市背後的故事,目前還在起步階段。

選餐廳:北京追網紅,上海覓小眾

俗話說「民以食為天」,飲食也是構成城市性格必不可少的一部分。我們通過分析大眾點評的數據做了關於兩座城市推薦餐廳的研究,其中數據主要是從大眾點評上的社區推薦上爬取了大家推薦的不同商鋪信息和傳播情況。

通過對比北京和上海的推薦數據,我們發現在北京大家更傾向於去推薦人氣餐廳、網紅餐廳、爆款餐廳,而在上海大家更喜歡推薦小眾、有特色的餐廳,且推薦的接受度比北京要高一些。

當然這只是我們巨大研究鏈條當中小小的一環,但從這個小細節上可以看到兩座城市的性格差異。北京更傾向於追求人氣、熱鬧的消費氛圍,但上海相對於北京而言,更看重小眾、獨立、私人化的消費氛圍。

比文化:北京愛歷史,上海重商業

文化是時間的沉澱,更是城市永恆的追求,一個具有特殊文化品格和精神氣質的城市,無疑是最具吸引力而叫人難忘的。那麼北京和上海在城市文化上相比又如何呢?

我們爬取了豆瓣同城上的數據,這些數據內容包括在城市範圍內發生的文化活動的名稱和性質、參與者的發生時間、消費門檻、文字描述等信息。

我們利用這些數據做了關於活動特性、活動參與者、活動發生地點等分析。以下兩張地圖是根據北京和上海豆瓣同城上的活動數據(活動距離商圈、文明古迹、老城區等的距離)進行的分析。

通過這兩張地圖可以明顯發現,北京的文化活動距離歷史街區、文化遺產更近一些,而上海的文化活動更靠近一些商業機構和商圈。基於這一結果可以猜測,北京的文化活力、文化內容更為明顯地受到了其歷史文化的影響;而上海更為核心的發展動力是其商業文化或是商業動機。

下面這一張圖是關於活動類型的對比:

我們依據活動內容的描述將其劃分成兩個類別,第一類是傳統文化類的活動,包括京劇表演、手藝表演、城市文化資源分享等;另外一類是創業類的活動,主要是工作坊、演講培訓、遊戲等。

那麼從比例上,大家可以發現北京的傳統文化活動明顯高於創業類文化活動,而在上海這個數值上則很接近。這更明顯的反映,商業文化對於文化活動在上海的滲透,也從側面表現出上海的城市性格更傾向於追求一種價值的分享,而北京更多的是關於文化體驗、傳承的分享。

小區名:北京喜復古,上海崇洋氣

除了情感、飲食和文化,北京和上海在小區命名上也存在著很大的差異。

我們對比了不同城市住宅小區的命名,通過把小區名稱、小區位置、小區類型、房價規模等數據提取出來進行一系列研究。從中我們發現了一些很有意思的成果,下面節選了北京和上海的兩個小片段。

北京(尤其是在2005年以後)的小區,在命名上喜歡田園風或是中國風,而上海則更偏愛國際經典情,下圖列表上有幾個例子:

大家可以看到像耕天下、禮士閣以及江南山水、揚州水鄉這種「CP感」明確的小區名字越來越多;而在上海則會看到更多舶來詞,如城市經典高迪、莫奈莊園、矽谷商墅等。

這些名字也反映出了所在城市居民的價值取向,我們研究了兩種類型名字在整個城市小區中的佔比情況,可以看到相對來說北京用田園復古風的命名會更多一點,上海則用國際風的命名會稍多一點。

第二張圖是關於兩種風格房價的對比,由於涉及到房價數據,數據比較敏感,所以很難橫向對比,我們是通過對比這一類型房子均價大概是全市均價的多少倍數得到的。很容易發現在北京,以復古風命名的小區明顯會賣得更貴一些,而上海則是相反。

以上只是城市象限研究的一部分,但我們的研究不止這些,目前我們還有一個腦洞是關於如何通過城市地名的命名方式去挖掘城市的性格,觀察衚衕街道名稱、橋樑道路名稱、水系名稱等數據,從中發現城市的價值取捨、希望寄託、外來文化、紅色文化等對城市的影響。

舉例來說,通過看全國有多少紅旗街、紅旗路以及分布在全國的哪些地區;又或者通過對比北京衚衕和上海弄堂的命名,從而發現當中寄託了城市什麼樣的願景;還有歷史傳流下來的文化圖騰的命名方式……這些都能讓我們發現各個城市的性格特點。

關於我的分享就到這裡,希望能給大家帶來啟發。

註:以上內容根據張希煜在數據俠線上實驗室的演講實錄整理,有刪減及部分調整,已經本人審閱。本文僅為作者觀點,不代表DT財經立場。

作者 | 張希煜

編輯 | 項靜 : xiangjing@dtcj.com

題圖 | 視覺中國

期待更多數據俠乾貨分享、話題討論、福利發放?在公眾號DT數據俠(ID:DTdatahero)後台回復「數據社群」,可申請加入DT數據社群。

數據俠門派

本文數據俠張希煜,北京城市象限科技有限公司地產業務總監,心理學出身的文本數據愛好者,希望通過廣泛的公開文本信息分析城市情感。

加入數據俠

「數據俠計劃」是由第一財經旗下DT財經發起的數據社群,包含數據俠專欄、數據俠實驗室系列活動和數據俠聯盟,旨在聚集大數據領域精英,共同挖掘數據價值。了解數據俠計劃詳情請回復「數據俠計劃」,投稿、合作請聯繫datahero@dtcj.com。

weixin.qq.com/r/qTkRCcb (二維碼自動識別)

推薦閱讀:

為什麼北冰洋汽水沒有做大,只在北京地區做得還行。?
《北平懷舊》序
人類都在為什麼活著?
北京五道口的「宇宙的中心」這一稱號有什麼由來?
北京的姑娘能有多好看?

TAG:北京 | 上海 | 性格 |