介紹幾個有意思的數據

介紹幾個有意思的數據

來自專欄商學院博士汪俱樂部

很久以前我談過新人怎麼尋找有意思的數據的問題(社科類博士生如何構建自己的數據集?)。當時我總結了這麼幾條路:找老闆;翻文獻;跑圖書館。

其實有一個前提條件我沒有說:還需要讀者認真專註,不放過任何有潛力的數據源。有意思的數據之所以有意思,往往是因為其他人想不到或者認為做不到。在沒有趁手的軟體工具,網路資源極其匱乏的年代,還有學者從年鑒和報紙里「徒手」扒出了大量的資源。(且看我上一篇文章里廣告行業小紅書和陳明哲老師的航空業動態競爭數據的例子。)今人有爬蟲在手,數據處理軟體一抓一大把,沒有理由不找到更好的數據源。

下面用我偶然間看到的網頁作為例子作為介紹。由於「有意思」本身是一個主觀色彩濃厚的詞,有必要給這些數據加一些限定詞。這些數據:

  1. 尚沒有人用過或者沒有被人充分挖掘利用過
  2. 適合戰略管理與組織理論的定量研究

境外投資企業(機構)名錄。商務部有一套境外直接投資審核系統。原來會把所有經過審批的企業名單以網頁形式列出來。理論上這套名單記錄了1980年至今的所有中國企業對外直接投資記錄。從1980年到2015年有大約三萬條審核記錄。每條記錄大概提供這些內容:東道國、投資者名字、海外企業名字、投資者來自哪個省(中央企業會寫成中央)、經營範圍、審核通過時間。

很可惜,這個網頁現在已經打不開了。但是互聯網上有很多關於這套數據的討論,有的人曾經把這套數據整個抓下來過,所以互聯網上能找到下載。但是數據質量就不一定有保證里。

適合的topic:所有International Business相關的研究。

歷年對外直接投資統計公報。商務部出版的工具書,現在有pdf格式下載了。這個數據並不獨特,類似的數據在聯合國貿發會議網站里也能找到下載。我個人的使用心得是這裡的國別數據比貿發會議數據要準確一些。

適合的topic: International Business里的national-level studies.

基金會中心網。印象中在中國運行的公益/慈善基金按法律是必須披露年度運營情況的。基金會中心網就提供了這樣的平台。目前網站可以查詢6578家在中國運營的基金的情況介紹(包括成立時間、地址、網址、聯繫方式、運營的項目信息、主要財務數據、透明度評分等等)。目前我沒有看到過用這套數據做論文的例子。

適合的topic:organization theory (resource-dependence theory, organizaional ecology, legitimacy等等)

商務部業務系統統一平台--直銷行業管理。偶然間看到的網頁。直銷是受監管行業,所有新成立企業、網點、變更業務範圍、調整產品線都需要公示。這些信息給研究企業內部運營和戰略選擇提供了一個很好的窗口。

適合的topic:太多太多了,隨便想到的就有competitive dynamics, multi-point competition, diversification, strategic change, firm survival/mortality等等,裡面的一些城市網點數據用上還可以加上spatial economics和地理經濟學的內容,簡直不要太贊。

論文大燜鍋 | Bigger Size, More Confidence:中國地市級黨委書記及市長資料庫 很久以前這個知乎專欄就公布過這套數據。對於戰略管理的研究而言, 這套數據至少有三個意義。一是可以為大量研究政治聯繫(political connection)的文章提供可靠的數據來源了;二是在其他firm-level的研究里可以用來算控制變數;三是作為主力數據,可以用來研究個體的social status,career path之類的問題。


暫時想到的就是這些。這些數據源頭多樣,不僅僅局限於成文的資料和資料庫,恰好滿足了「有趣的」數據的要求。希望對諸君有幫助。如果你也有新奇的數據要分享,歡迎投稿或留言回復。:-)

推薦閱讀:

Category theory的相關學者索引
為什麼職位越高的人,越需要「模稜兩可」?
馬斯洛的需求層次理論:騙局還是誤解?
乾貨·圖文|狼性文化之思
管理學中決策類型備考

TAG:數據 | 學術研究 | 管理學 |