請問如何收集到論文寫作需要的數據?

我們計量經濟學老師讓我們寫一篇論文,要求題目越新穎有趣越好,但是我覺得越是好玩的題目,數據的收集工作越困難。不知道大家在論文寫作的時候或者其他需要對數據進行分析的時候,都是從哪收集數據的。

我們平時都是用用統計年鑒里的數據,但是裡面的數據好無聊啊…所以想拓展一下數據收集渠道,求大家的分享~~


作者:欒教授
鏈接:知乎專欄(點此鏈接,關注「畢業論文指導」專欄)
來源:知乎
著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。

國內主要數據網址:

想要統計年鑒的在線版,請進:國家統計局資料庫 http://219.235.129.58/welcome.do 所有的數據都可以生成excel格式,這樣可以省掉從紙質版的統計年鑒一個個抄下來的麻煩,省你半年的青春,關鍵是還可以直接求平均數,方差等數據的基本屬性。
教育類的統計數據,請進:中華人民共和國教育部政府門戶網站 ,更詳細的還是要找《中國教育統計年鑒》。
醫療衛生的統計數據,請進:中華人民共和國國家衛生和計劃生育委員會 ,點擊「衛生統計」,後面還有好多的東西,自己找自己想要的吧。更詳細的還是要找《中國衛生統計年鑒》
財政的數據,請進:http://www.mof.gov.cn/ ,點擊「財政數據」,有一些零散的公開數據,不知道有沒有大家想要的。當然更詳細的還是要找《中國財政年鑒》。
環境保護的數據,當然少不了環保部了,中華人民共和國環境保護部 ,點擊「統計信息」,每年的環境統計年報,全國環境統計公報,數據是最新的,確實找不到想要的數據就只能求助《中國環境年鑒》了。
科技方面的數據,請進:中華人民共和國科學技術部 ,點擊右下角的「科技統計」,裡面有統計報告,主要統計數據,科技統計資料彙編等。和《中國科技年鑒》內容完全一樣的。
勞動與社會保障的數據,請進:中華人民共和國人力資源和社會保障部 (是不是有點熟悉呢,對了,就是國考的報名網站),點擊「專題專欄」中的「規劃與統計」,是不是資料就來了呢?規劃計劃,統計公報,《中國勞動統計年鑒》應有盡有。
發 改 委,最雜最全最新:中華人民共和國國家發展和改革委員會 ,點擊右上角「高級查詢」,輸入關鍵字,有很多的資料。(提醒注意,由於數據是地方上報的,數據的真實、可靠性請注意甄別!)
最新出版的,《新中國六十年統計資料彙編》是好資料,強烈建議大家看看,找找看有沒有自己想要的數據。當然你也可以到百度裡面,百度一下,輸入關鍵字,後面加個「.pdf」,「.doc」,「.ppt」(注意有個「點」的),看看有沒有你想要找的資料。

證券業數據:理想論壇:機構研究報告交流區 需免費註冊,無其他許可權要求。其附件似乎直接另存為有問題,可以用迅雷下載解決,或去天下財經,新浪財經等上面會有一些,也很不錯。其餘的還可以到google之類的搜索引擎上搜索 ×××× filetype:pdf, 即搜索pdf格式的文件,常有驚喜。

國外主要數據網址(有的網址知乎不是別):

站點1:http://www.shujuhui.com/database/
這個網站我上次已經推薦過了,是中文的,而且數據種類多也有更新。中美英德歐日法的數據都有。有搜索,可設時間,可下載數據。第一次載入需要比較長的時間,請耐心等待。有的時候卡住就過一會試試,似乎伺服器不太給力的樣子

站點2:Federal Reserve Economic Data
大名鼎鼎的FRED,不用我多說了吧,搜索引擎很強大會給出數據的人氣指數,基本上我的日誌圖表都是在這個庫裡面查詢的。
站點3:OECD iLibrary: Organisation for Economic Co-operation and Development
經合組織的資料庫,我個人不太常用
站點4:http://databank.worldbank.org/data/home.aspx
世界銀行資料庫,可數據和圖標切換,看著有點亂。
站點5:Time Series
頁面簡潔名了 Subject Reporter Partner Trade Flow Unit Year選完出數據
站點6:The World Factbook

數據太少,視覺效果還不錯

站點7:NationMaster: Stats by Category
數據多,分類不錯,搜索簡單
站點8:http://elibrary-data.imf.org/DataExplorer.aspx 站點9:China — Topic page

站點10:China - U.S. Energy Information Administration (EIA)

站點11:http://www.economywatch.com/economic-statistics/#stats

基本的經濟數據都算列全了

站點12:http://www.economywatch.com/economic-statistics/#stats
這是一個數據導航站,把你引到相關數據源
站點13:ECB Statistical Data Warehouse

歐央行的資料庫

站點14:Statistical annex to European Economy. Spring 2012

歐洲季報,提供如下數據

population
labour market
output
national final uses
prices
wage costs
foreign trade and current balance
saving
monetary indicators, and
public finance


謝邀。

選題新穎不等於數據要新穎。數據新穎也不等於選題會新穎。

不過你們老師要求要選題要越新穎有趣越好,我覺得這個要求挺高的,不知道你們要寫哪方面的內容,反正我是覺得這年頭要找個新穎的題目真是不容易,對於學計量沒太長時間的學生來說就更難了。我想還是選一個自己能駕馭的了的題目好一些。

至於數據,寫不同內容的論文,數據來源也不一樣,不知道題主是要寫什麼題目。不過那些能夠直接獲取的數據基本上都不新穎了,新穎的數據要不就得去花錢買,要不就得自己搜集。所以為了一篇課堂論文,還是有什麼數據就用什麼吧。


各大資料庫,以及可以用軟體直接從網上抓取資料,現在就又很多商業性的數據收集工具,用來作為分析材料一樣是可以的。


互聯網上有很多公開的數據是可以用來做挖掘分析的,感覺容易獲取的是社交平台上的數據,例如:微博、qq空間、天涯之類的,網上找個採集工具,把這些數據抓下來就可以了,具體得看你要研究的課題是什麼,根據需要,可以到互聯網找數據,個人用得比較好的一款採集工具叫gooseeker,如果要采網上數據,可以試試


各個國家的data service. 各種開放的census數據。 CIA官網, 諮詢公司的報告, 金融公司的 annual report 或者你可以自己收集。


前面有答主回答得非常詳細,下面我也說一些吧,比較懶的可以參考下。

最常用的就是國家統計局的數據吧,不過它其實能提供的數據比較有限,比如你要查教育類的統計數據,最後還得到教育部網站,要查醫療衛生相關的你要去國家衛計委網站,要查勞動就業相關數據要去人力資源與社會保障部網站,進去了之後還得自己找,有些數據還不直觀,你得耗時耗力的自己整理出表格或者製作成圖片。還有一些數據,比如企業年報這樣的,想查起來就更難了。

那麼問題來了,怎樣在這些環節上偷個懶呢?

其實現在已經有公司想到了這一點,在數據採集能力不及上述網站的情形下,有公司就想到了讓懶人更加省事的辦法,就是將數據整合到一個平台上,同時針對這些數據的不足做補充,最終實現一鍵查詢。

在搜索了一下數據相關詞後,本人親測了一下前瞻資料庫。

搜索廣東GDP後,會展示一個與你搜索詞比較相近的結果,進入其中一個是這樣的:

直觀簡潔,還支持導出表格,如果你想要製作成圖表的話,還可以使用它自帶的在線圖表製作工具

導入後結果是這樣的:

然後下載下來就可以了。

歡迎點贊!!!


你可以試試維基解密里的數據,比如英國現在納粹主義者的居住分布。


數據資料...如果能夠實地調查最好,如果不能就在網上找一些,應該會有一些調查報告,一些學位畢業論文里也會有,政府機關公布的資料裡面也會有相關數據。總之,要勤快,要辛苦一下。希望能幫助到你。


宏觀數據,企業數據,個人數據。

占樓待編輯。


一般來說,數據來源可以分為內部數據和外部數據。

1)內部數據:分為企業的銷售數據,運營數據,購買的資料庫的數據等。

2)外部數據:可以從不同緯度劃分,

-- 按數據性質分,可以分為定性數據和定量數據。舉例,廣告主的態度數據就數據定性數據;市場份額是就是定量數據。

-- 按付費與否分,可以分為付費數據和免費數據。當然免費數據是我們獲得數據較快的途徑,但付費數據通常有更高的可信度,更好的背書效果,更好的數據延續性等等優點。

-- 按數據出處分,可以分為行業數據(行業協會發布的數據),調查數據(調研公司發布的數據),普查數據等等


所謂廣泛搜集資料,就是儘可能了解前人對這一問題已經發表過的意見。這些意見可以給我們啟發。他們已經取得的成果,正確的,可吸取、繼承,錯誤的,可批判、糾正。他們有時結論是對的,但引例不當,或論證缺乏邏輯性;有時引例生動恰切,論證也有嚴密的邏輯性,但結論卻錯誤;有時從引例、論證過程和結論都是錯誤的。他們正確的體系中,可能有錯誤觀點,錯誤的體系中,又可能有合理的因素。凡此種種方面的資料,我們都要力所能及地搜集。這種掌握某一問題全部資料的方法,就是「竭澤而漁」的方法。經過「竭澤而漁」的工夫收集資料,寫出的論文就具有了堅實的基礎,就能立於不敗之地,也就有重要的學術價值。但是,有時受條件的限制,百分之百地獲取資料不易做到,但是,重要的有代表性的資料是一定要閱讀、考察的。馬克思撰寫《資本》論遍讀了當時西方各國全部有關經濟學的資料。列寧寫作《唯物主義和經驗批判主義》,也閱讀了當時西方几百種關於哲學、物理學的著作和論文。要寫出六、七千字的一篇論文,最少得閱讀三、四十萬字的資料。不大量地閱讀、搜集、記錄資料,要想寫出高質量的論文是難以想像的事。

搜集資料時還要注意:

(1)不要滿足於第三手、第二手資料,要儘可能搜集第一手資料即原始資料。因為第二、三手資料可能有錯訛之處,而第一手資料,沒有經過別人改動,比較可靠。

(2)搜集的資料應包括感性的和理性的,既包括理論觀點,又包括典型事例、數字、圖表等與論題有關的東西。

(3)自己所選的論題,別人從未研究過,根本沒有這方面的資料,搜集什麼呢?如要評一篇別人剛發表的沒有評論過的新小說,該如何搜集資料呢?那就要披閱作者的其他作品,了解作者的情況,了解本作品發表的時代背景、作品所反映的實際生活、體現的思想感情以及是如何體現的,有何特色和社會意義等等。

(4)搜集的資料不僅是與論題相應的本學科的資料,還應有與論題有關的其他學科的資料。如要寫一篇關於修辭格的論文,除了搜集本辭格的資料外,還要搜集與分析本辭格有關的哲學、心理學、邏輯學、美學、文化學、文藝學等方面的資料。只有這樣,才 有可能把論文寫得透徹、有深度。


推薦閱讀:

2016 年美国大选的民调准确率如何?如何提高民调的准确率?
入行大數據需要掌握哪些技能?
如何判斷一個行業的興衰呢?
怎樣判斷一個人是否適合做數據分析?用什麼題目測試更有效?
大數據理論如何指導交通數據分析?

TAG:數據 | 數據分析 | 經濟學 | 論文 |