做投行、行研、諮詢等金融崗位,有沒有什麼好用的找數據技巧呢?

對於找數據,有些時候是一件非常痛苦的事情!

經常遇到:
找到了數據,卻無法溯源,而數據不能使用的時候?
數據說法不一,而沒有一個官方的來源,無法抉擇的時候?
有些數據就是找不到,不知道如何闡述某個問題的時候?
有些數據明明就有,卻來自於某些諮詢公司,標價動不動就是上千,刀!

所以想問問有沒有什麼找數據的好方式能夠分享呢??


沒有被邀請,但是依舊逼格滿滿地說,這個問題簡直就是為我準備的。

第一部分:吐槽+吹牛
(特此說明,本文不針對quant投資的大神)
本人工科本科,畢業後做戰略管理諮詢,其後做過股票交易員以及VC/PE投資。所呆的機構基本都是行業內的頂尖公司,而個人表現基本都是明星級員工。

說到此處,我已經感覺到無數飛過來的臭雞蛋的風聲,都來自於各位professional service的人士。下圖是我被臭雞蛋砸中的樣子,只是我的顏值略遜於她。

但是,我說的是真話。原因不是我業務好,而是我工具用得好、程序寫得好。簡單一句話總結:我是做諮詢/投資裡面最會寫程序的,也是寫程序裡面最懂諮詢/投資的。以下為一些亮瞎合金眼的案例:

  • 在諮詢的日常工作中,寫過一套基於VBA優化及生成PPT和連通Powerpoint-Excel-Word數據的軟體,離職讀MBA前被Global IT買走,因為公司給了我MBA的學費及生活費,免費給了,在公司廣為流傳
  • 在某諮詢項目中,寫過一套幫助某國際消費品牌基於內部海量數據來規劃渠道商和代理商布局的軟體,將以前需要一個sales team一整天才能完成的工作縮到一個人一小時內完成,並作為重要成果在整個亞洲推廣
  • 在某諮詢項目中,寫過一套工具,實現將Excel中每天都在更新的甘特圖及流程圖按規定格式同步到給客戶的高標準高逼格PPT中。因為這是一個新品牌車系的上市項目,流程圖極其複雜,每次更新都要耗費行政助理團隊整個通宵的時間,還不能保證完全正確。這套工具,解放助理不用stand-by,按時按點回家洗洗睡睡。
  • 在基金的日常工作中,寫過一套VBA工具並結合Bloomberg介面,每日抓取目標公司的各類信息並發送日報,將一個專職助理半天的工作基本縮減到零
  • 在諮詢/基金的日常工作中,做過無數的Financial Model,面對老闆及客戶的各種花式虐狗需求,根據假設算出結論或者根據結論算出假設,程序自動完成;而且Financial Model的復用性極高,而且財務三張表自動配平。(說起根據結論算出假設,這個聽起來不靠譜的需求,做過這一行的同學,一定會懂啥叫用戶需求)
  • 將諮詢這種累死累活的工作,做成了朝九晚五,按我們以前老闆的話說:我是在用coding做consulting。日常工作中,幾個實習生或者數據分析員要花一整天才能整理好的數據,被我花半小時完成的Python或者VBA秒殺,這種案例就不多說了

如果沒有上面的工具,所有從業人員的表情都是下面這樣的。

特別是遇到作的老闆或者客戶,從早做到晚,做到死也做不完呀。

有了這些數據大法,表情就是下面這樣的了。

說到這裡,我再次感覺到無數飛過來的臭雞蛋的風聲,都來自於各位編程大牛。我看到的情景如下圖,扔雞蛋的人更多了。

因為這些程序實在沒啥難度呀,又不是函數編程,又不是Deep Learning。但這卻是骨感的現實,只能說明兩個事實:

  • Professional service對技術的應用簡直low爆了,或者說在數據處理方面基本沒有,僅限於Office系列。親眼所見一個知名對沖基金的研究員,一頁一頁得手工翻看搜房的網站,並用Ctrl C+Ctrl V記錄搜房所有自有經紀人的信息到Excel,並統計他們當前的成交量。然後每周做一次,查看每個經紀人的成交量增量。通過這樣的數據分析來判斷搜房轉型到自由經紀人業務之後,模式是否成功。因為工作量實在巨大,後來只好請了一票實習生來做。
  • 跨界就是優勢,懂業務懂技術,就是能做出改變。世界越來越平、技術越來越開源,越來越多的公司或者模式並不是單純靠技術優勢,而是靠對用戶需求對業務的了解以及迅速滿足需求。

第二部分:數據的三大法寶
如同自己約的炮含淚也要打完,吹這麼多牛,一定要給出乾貨來填坑。現在祭出三大法寶:Excel、VBA以及爬蟲。要想把數據做好,不僅僅是要找到數據,還要把數據清洗好和分析好。所以我不僅僅給出找數據的法寶,而是給了一套。

Excel是迄今為止最簡單最便捷得處理數據的方式,下至四則運算,上至各類統計分析、矩陣運算及線性規劃都可以搞定,所以一定要熟練掌握。網上資料很多,在此就不贅述了。但是Excel深不可測,基本沒有天花板,千萬不要以為會了VLookup及一些快捷鍵就可以耀武揚威了。至少需要把矩陣乘法、向量乘法、Offset/ Cells/ Row/ Range等函數用到極致,這樣大多數Financial Model會做得非常靈活,而且各種數據查詢及匹配工作會達到部分SQL的處理水平。

VBA會讓Office的能力提升一個檔次,除了完成函數不能完成的一些任務,最有價值的是能夠在Office的各套軟體之間實現信息同步。之上提到的許多軟體都是基於VBA完成的,最重要的沒有版權問題。不過學習辦法也不難,參見Excel VBA 如何快速學習? - 何明科的回答,至於高階技能參考粉絲回饋:程序讓你更性感 - 數據冰山 - 知乎專欄。

爬蟲我需要細說一下和重點說一下。因為這是解決題主多次提到的數據找不到的問題。
所謂爬蟲當然不是下圖的蟲子。

而是這樣的蟲子,其實就是一套自動讀取網頁和解析網頁的程序而已。用python或者Go等程序語言寫出爬蟲程序來自動抓取網路數據,利用正則表達式等技術手段將臟數據清洗並結構化放入到資料庫或者Excel,然後作分析以及長期監控。

網路上的數據越來越多,越來越能代表生活中的真實現象。通過爬蟲加正則這種自動化的工具,能夠耗很少的人工就可以將數據和信息採集並結構化,後續通過更多的分析工具完成許多有商業價值的分析並獲取所謂的insight(將信息轉化為知識和洞察)。

還記得上面提到的那個肉眼數搜房網網頁的分析員的故事嗎?然而其實這就是一個程序員用Python做好爬蟲、結構化數據和最後分析的簡單事情,於是出手相助才有了如下的分析。輕鬆將搜房在各個城市的經紀人數量及單產搞清楚並按時監督,計算搜房在自有經紀人業務線的產出不是問題。
http://xueqiu.com/3917381252/45640644

另外,還有基金在投資挂號網之前,讓著幫忙做些數據統計和調研,於是有了下面的回答:如何評價挂號網? - 何明科的回答。下面的圖表結合了從挂號網抓取的數據以及宏觀數據。

當然,給基金幹活,數據的可視化很重要,於是用了文圖 ,將圖表畫得很炫,逼格頓時提高。並不覺得比頂級諮詢公司的PPT差到哪裡。即使比他們差了,用他們的格式在網上實現一遍也就可以了,然後還可以共享給大家。一些炫目圖標的效果如下。下圖是關於世界各國的智商分布(http://wentu.io/publish#fd5da46583e2c60f)

下圖是重慶小面如何風靡全國的 - 數據冰山 - 知乎專欄。

下圖是RIO是如何席捲大江南北的? - 數據冰山 - 知乎專欄

另外,還可做許多比較酷的事情,獲取真正的insight,如下的東西無論是諮詢項目還是投資項目,或許都能用得到,絕對都能讓老闆虎軀一震,讓客戶嬌喘連連。

  • 看看咖啡的推廣到底如何:為什麼麥當勞和肯德基都開始注重現磨咖啡的推廣,其優勢與星巴克等傳統咖啡行業相比在哪裡? - 何明科的回答
  • 幫助自己買車:一年當中買車的最佳時間為何時? - 何明科的回答
  • 看看最近是否適合換工作:互聯網行業哪個職位比較有前途? - 數據冰山 - 知乎專欄
  • 看看最近的房價和走勢:下半年深圳房價將如何發展 - 數據冰山 - 知乎專欄,深圳的房價是在三個月內暴漲起來的嗎? - 數據冰山 - 知乎專欄, 學區房到底鬧哪樣? - 數據冰山 - 知乎專欄
  • 滿足吃貨的好奇心:重慶小面如何風靡全國的 - 數據冰山 - 知乎專欄
  • 最後的大雜燴:能利用爬蟲技術做到哪些很酷很有趣很有用的事情? - 何明科的回答

技術方面,Python寫爬蟲非常方便,調試正則這個網站很不錯Online regex tester and debugger: JavaScript, Python, PHP, and PCRE。

第三部分:等待改變的Professional Service行業
諮詢、投行、投資、審計、律師等等,籠統得被稱之為Professional Service,一直是以高大上形象出現的,往往瞧不上屌絲草根居多的技術行業。然而時代在變化,技術的力量在不斷崛起,並摧毀和變革越來越多的行業。然而,Professional Service除了在上個世紀用上Office、互聯網以及手機之後,整個行業並沒有引入太多的技術,特別是在數據獲取、分析及可視化方面。

再隔十年回頭看如今的諮詢/投行/投資行業對技術的運用,會如同我們現在回望上世紀七十年代左右,我們的前輩在紙上或黑板上畫PPT、在紙上算數然後展現給客戶看的情景:真心覺得好落後。下圖是波士頓諮詢公司創始人及戰略大師布魯斯·亨德森智庫(Bruce Henderson Institute),在黑板上給客戶演示著名的波士頓2x2矩陣,桌子上沒有電腦,而是一堆草稿紙。

所以我一直希望將技術引入到這個我曾經工作多年的行業,做出些改變。讓所有從業人員的工作更輕鬆,讓所有從業人員為客戶帶來更大的價值。在這篇回答中(你用 Python 做過什麼有趣的數據挖掘/分析項目? - 何明科的回答),對我的這個理想其實有所交代。

基於以上的初心,已經嘗試著開發了兩款產品。讓上面提到的數據相關的工作更加簡單和有效。

第一款:選址應用
選址是現在許多公司頭疼的難題,以前完全是拍腦袋。因此我們開發出這樣一套工具,幫助公司能夠更理性更多維度得選址。

下圖,我們抓取多個數據源並完成拼接,根據用戶的快遞地址,勾畫出某時尚品牌用戶的住址,幫助其選址在北京開門店。

下圖,我們抓取多個數據源並完成拼接,根據大型超市及便利店與某類型餐館在廣州地區的重合情況,幫助某飲料品牌選定最應該進入的零售店面。

第二款:數據可視化
我們在工作中也深刻覺得以前製作圖表和展示數據的方式太low、太繁瑣,我們希望去改變這個現狀,於是開發了一套基於Web來製作圖表的工具文圖。遠有Excel/Powerpoint對標,近有Tableau對標。下圖是文圖豐富的案例庫及模板庫。

下圖是簡單的使用界面及豐富的圖表類型。

下一步的工作:

  • 與微信的整合,一鍵生成適合於微信傳播的截圖以及公眾號格式文章,便於在社交媒體的傳播
  • 收集更多數據,目前已經覆蓋40多家網站,涵蓋衣食住行等多個方面
  • 將數據SaaS化和開源,便於各類公司及用戶使用。(諮詢投行等Professional Service人士一定會懂的,你們每年不知道要重複多少遍更新各類宏觀微觀的經濟和行業數據,現在只需要調用KPI)

最後,希望有一天它能部分替代已經在江湖上混跡二三十年的PowerPoint及Excel。我們現在的模式大致如下:中國目前數據分析數據挖掘市場情形是怎樣的,機會多嗎?前景如何? - 何明科的回答。

————————————————————————————————————
更多文章關注我的專欄數據冰山 - 知乎專欄
更多精彩回答請看何明科的主頁


一、券商研究報告下載
(收費)
彭博 萬得 WIND
湯森路透 Capital IQ
巨靈金融服務平台 同花順
慧博投研資訊 慧博投研資訊-中國最大最專業的投資研究平台
(免費)漸飛 漸飛研究報告-全國最大的股票研究報告分享平台 研究報告,投資股票,證投資,行業研究,市場分析報告


二、其他來源
人大經濟論壇 人大經濟論壇-國內最大的經濟、管理、金融、統計在線教育和諮詢網站
人大經濟研究所 http://ier.ruc.edu.cn/
百度文庫,百度雲 豆丁網
新浪愛問 谷歌 (filetype:pdf)
維普,萬方等平台 各大諮詢公司
www.aol.com裡面的搜索引擎功能有google提供,搜索結果與google一樣,如果google無法登陸,可以用這個網站代替
全景網:財經資訊 全景網:權威財經資訊網站


三、各大諮詢公司報告下載頁面
德勤中國 | 審計, 企業管理諮詢, 財務諮詢, 風險管理, 稅務服務及行業洞察。
Deloitte | Audit, Consulting, Financial, Risk Management, Tax Services。
http://www.kpmg.com/CN/en/IssuesAndInsights/Pages/default.aspx。
McKinsey Greater China。
IBM - 全球企業諮詢服務部。
http://www.bcg.com.cn/cn/newsand ... s_publications.html。
商業評論網—打造最有影響力的管理者社區。
http://www.ey.com/CN/ZH/home/library。
貝恩觀點 貝恩公司。
https://china.mckinseyquarterly.com/home.aspx。
http://www.pwccn.com/home/eng/libraryindex.html。
http://www2.hewittassociates.com/Intl/AP/zh-CHT/Default.aspx。
http://www.booz.com/global/home/ ... ding-research-on-ma。


四、上市公司公告
香港證監會上市公司公告
http://www.hkexnews.hk/listedco/ ... h_active_main_c.asp
美國證監會上市公司公告
http://www.sec.gov/edgar/searchedgar/companysearch.html
中國上市公司公告
http://www.cninfo.com.cn/information/companyinfo/html


五、統計局網站信息匯總
國家統計局 http://www.stats.gov.cn/
【北京】北京市統計信息網 http://www.bjstats.gov.cn/
【天津】天津市統計信息網 http://www.stats-tj.gov.cn/
【河北】河北省統計局 http://www.hetj.gov.cn/
【河南】河南省統計局 http://www.ha.stats.gov.cn/
【黑龍江】黑龍江省統計信息網 http://www.hlj.stats.gov.cn/
【吉林】吉林省統計信息網 http://tjj.jl.gov.cn/
【遼寧】遼寧省統計信息網 http://www.ln.stats.gov.cn/
【山東】山東統計信息網 http://www.stats-sd.gov.cn/
【江蘇】江蘇省統計局http://www.jssb.gov.cn
【江西】江西省統計局 http://www.jxstj.gov.cn/Index.shtml
【安徽】安徽統計信息網 http://www.ahtjj.gov.cn/
【山西】山西統計信息網 http://www.stats-sx.gov.cn/
【陝西】陝西統計信息網 http://www.sn.stats.gov.cn/
【湖北】湖北省統計局 http://www.stats-hb.gov.cn/
【湖南】湖南統計信息網 http://www.rcinfo.gov.cn/tjwh/tjwh/tjwh.files/hntj.gov.htm
【貴州】貴州省統計局 http://www.gz.stats.gov.cn/
【四川】四川統計局 http://www.sc.stats.gov.cn/sctj/
【雲南】雲南省統計局 http://www.stats.yn.gov.cn
【甘肅】甘肅統計信息網 http://www.gstj.gov.cn/
【青海】青海統計信息網 http://www.qhtjj.gov.cn/
【寧夏】寧夏統計信息網 http://www.nxtj.gov.cn/
【福建】福建省統計局 http://www.stats-fj.gov.cn/
【廣東】廣東統計信息網 http://www.gdstats.gov.cn
【廣西】廣西統計信息網 http://www.gxtj.gov.cn/
【浙江】浙江統計局 http://www.zj.stats.gov.cn/
【新疆】新疆統計信息網 http://www.xjtj.gov.cn/
【海南】海南統計局 http://www.hi.stats.gov.cn/
【上海】上海統計局 http://www.stats-sh.gov.cn/
【內蒙古】內蒙古統計局 http://www.nmgtj.gov.cn/
【重慶】重慶統計信息網 http://www.cqtj.gov.cn/


六、投行網站
http://macabacus.com/ http://www.wallstreetoasis.com/ http://www.ibankingfaq.com/
IPO http://stocks.etnet.com.cn/www/sc/stocks/ci_ipo.php
IPO http://www.aastocks.com/sc/ipo/sponsor.aspx
juling http://terminal.chinaef.com/index.action
MA http://www.mergermarket.com/info/


七、其他資源網站
統計學軟體網站 http://www.ats.ucla.edu/stat/
下載軟體 http://app.hustonline.net/index
註冊國家圖書館 http://www.nlc.gov.cn/


MIT data base
http://libraries.mit.edu/multi/research-guides.html http://data.un.org/ http://libguides.mit.edu/market http://libguides.mit.edu/corpreports


八、資料庫整理
1、國研網資料庫
http://edu.drcnet.com.cn/DRCNet.Edu.Web/
特點:統計資料庫包含宏觀數據、金融、教育、行業數據等,但是宏觀數據年度跨度不大。適合對個別指標進行跨省、跨時間的統一檢索。另外有全文資料庫等,包含一些專家學者的文章,可以作為參考。
2、中經網
http://162.105.138.185:90/scorpi ... 1014amp;h=708
特點:以宏觀數據為主,包含國家一級、31個省以及200多個市的數據,與國研網的統計資料庫類似,統計項目沒有國研網多,但是有些指標年份跨度更大。適合統一檢索。
3、資訊行
http://www.bjinfobank.com/IrisBin/Select.dll?Special?db=TJ
特點:非常全的資料庫,幾乎囊括了所有最新的年鑒。適合尋找數據的來源。缺點在於:沒有1995年之前的年鑒,數據不是表格形式,需要自己修改。(可行的方法包括:粘貼到word中,把空白(^w)替換為製表符(^t),或者直接粘貼到excel2007,進行數據分列)。
4、統計局資料庫
http://219.235.129.58/indicatorYearQuery.do
特點:最近幾年剛出的,還在完善中。可以對統計局出版的年鑒數據進行統一檢索。(和1、2很相似)有時候能找到1、2所沒有的數據。
5、年鑒
http://www.stats.gov.cn/tjsj/ndsj/
包括歷年統計年鑒以及普查數據、專題數據等,適合瀏覽年鑒。實際上,目前很多最新年鑒,包括《新中國六十年統計資料彙編》、《2010年統計摘要》等都可以在網上下載到excel版本。
6、知網
http://epub.edu.cnki.net/grid2008/index.htm
6.1文獻
http://epub.edu.cnki.net/grid2008/index/ZKCALD.htm
非常全的學術文獻資料庫,包括了期刊、學位論文、學術會議論文等。這個加上維普的話,基本上可以把中國比較好的期刊論文都包括了。
6.2年鑒
中國統計年鑒資料庫(挖掘版)
http://tongji.cnki.net/Kns55/Nav ... OEFIV2ZBPT0=amp;p=
提供對統計年鑒的統一檢索,但是效果不理想,比較凌亂。列出了500部左右的年鑒,比較全,但是不一定有最新的。可以先在資訊行搜索數據指標所屬的年鑒,再在這裡找到年鑒。
7、維普
http://162.105.138.192/index.asp
有些知網上找不到的文章可以在這裡找到,文章很全。
8、英文資料庫
http://www.lib.pku.edu.cn/portal ... ew_sub_nvgt_db.psml
有BVD統計資料庫,包括各國的宏觀數據、金融數據、企業數據,有JSTOR,含有重要英文文獻,有Elsevier Science--學術期刊資料庫(science direct),非常全的英文期刊文獻。
另外還有:
http://springer.lib.tsinghua.edu.cn/ http://onlinelibrary.wiley.com/
9、人大經濟論壇
http://www.pinggu.org/bbs/
會有一些經濟學書籍、年鑒、軟體的下載。
10、圖書館主頁搜索相關的年鑒,也可以提供年鑒下載,但是好像不提供最新一期的。其實,google和百度也是常用的數據來源。圖書館的資料庫都是可以憑藉校內的IP直接登錄的,如果在校外的話可以使用代理伺服器或者VPN。在校外要登錄學校的資料庫,可以採用如下辦法:1,代理,https://its.pku.edu.cn/cysz/proxysz.jsp。2,vpn,https://its.pku.edu.cn/wlfw/vpn-o2-web.jsp。但是兩個都不穩定。

九、如何尋找國外的數據
1、搜集美國相關的數據
由位於華盛頓的美國政府印刷辦公室出版、經濟顧問委員會撰寫的《總統經濟報告》(Economic Report of President),提供了有關美國當前經濟形勢的描述和主要宏觀經濟變數數據。相當多的數據都可以追溯到1959年,甚至個別的可追溯到1929年。可能你已經留意到了,好多有關美國的圖形,都是採用《總統經濟報告》(2005)所附數據生成的。這些數據可以免費下載,網址是www.access.gpo.gov/eop/。
如果需要一應俱全安的數據,一個寶貴的權威來源是,美國商務部統計局出版的《美國統計概要》(Statistical Abstract of the United States),相當一部分數據可以免費下載,網址是www.census.gov/statab/www/。
如果想獲得最近數據的詳細資料,一個不錯的選擇是,美國商務經濟分析局每月出版的《當代商業縱覽》(Survey of Current Business)。網址是,www.bea.doc.gov。
2、如何搜集國外其他經濟體的數據
對富裕國家來說,最有用的資料來源於經濟合作與發展組織(Organization of Economic Cooperation and Development,簡稱OECD)。經濟合作與發展組織的成員包括:奧地利、澳大利亞、比利時、加拿大、捷克共和國、丹麥、芬蘭、法國、德國、希臘、匈牙利、冰島、義大利、日本、盧森堡、墨西哥、荷蘭、紐西蘭、挪威、波蘭、葡萄牙、韓國、西班牙、瑞典、瑞士、土耳其、英國和美國。看來,世界上的富裕國家大都屬於該組織,其產出佔世界產出的70%左右。OECD的網址是www.oecd.org,提供三種極為有用的數據。
《OECD經濟展望》(OECD Economic Outlook),每年出版兩次,提供許多跨國宏觀經濟數據。這些數據一般都上溯到20世紀70年代,而且具有很好的一致性。
《OECD就業展望》(OECD Employment Outlook),每年出版一次,專門提供勞動力市場的數據。 《OECD歷史統計》(OECD Historical Statistics),不定期出版,將當期數據和過去數據放在一起。
對於不是OECD成員的國家和地區,可以從其它國際組織那裡獲得相關數據,比如國際貨幣基金組織(International Monetary Fund,簡稱IMF),其網址是www.imf.org。IMF提供《國際金融統計年鑒》(International Financial Statistics Yearbook),它主要提供成員國的金融數據,但也包括一些總體數據,比如GDP、失業和通貨膨脹等。
至於若干國家長期的統計數據,兩個不可多得的數據來源是,Heston-Summers資料庫和Madison資料庫。Heston-Summers資料庫提供168經濟體在1950-2000年間的跨國可比數據,在賓夕法尼亞大學國際比較中心(Center for International Comparisons at the University of Pennsylvania)網站上可以下載,http://pwt.econ.upenn.edu/。Madison資料庫提供了自1820年以來56個經濟體的數據。
最後,如果還沒有找到你要的數據,不妨登陸下面的兩個網站,也許是根稻草。哈佛商學院的宏觀經濟學資源網站www.hbs.edu./units/bgie/internet/,提供了大量連接。由密西西比大學Bill Goffe維護的一個網站http://rfe.wustl.edu,不僅列出了數據來源,而且還列出了有關經濟的其他信息來源。


十、綜合性數據
SEC EDGAR資料庫
美國國會兩院記錄、商務部經濟數據、伯克萊圓桌會議、斯坦福法律經濟詞典
http://town.hall.org/radio/JEC
Web統計資源指南(密執安大學)
Statistical Resources on the Web (University of Michigan)由密執安大學文獻中心建立。這是一個內容廣泛、編排細緻的資源指南。包括以下類目:工商業、生活消費、圖表、經濟學、財政金融、國際經濟、國際貿易、勞動與就業等。 http://www.lib.umich.edu/libhome/Do...nter/stats.html
報價公司
提供有價證券的數據、信息。如有價證券一覽表、快報
http://finance.lycos.com/qc/default.aspx
產品價格指數(PPI)詳細報告
每月一次的產品價格指數報告和數據。包括最終產品和中間產品到原材料等)。
http://stats.bls.gov/ppihome.htm
房產起價和建築許可Housing Starts and Building Permits (US Census Bureau)
在這裡可以看到美國人口普查局最近發布的經濟指標。包括私有房產起價和當月、當年的建築許可摘要。
http://www.census.gov/pub/indicator/www/housing.html
高校財經資料庫
收錄 12個在線資料庫,超過三百萬篇商業報告和文章。
http://www.bjinfobank.com/
國際股票市場資料庫
包括國際股票市場的價格圖表、交易量、共同基金圖、上市公司簡介等
http://www.stockmaster.com/
國民收入和產品帳戶National Income and Product Accounts (University of Virginia)
這是佛吉尼亞大學社會科學數據中心的傑作。可檢索自1959年以來的數據。主要包括:政府收入和支出;收入、就業、工業產品;國民生產和收入;個人收入和消費;數量和價格指數;存款和投資等。
http://www.lib.virginia.edu/socsci/nipa/
華通數據中心
宏觀經濟信息、行業(產業)發展報告、企業(公司)信息、產品市場分析
http://data.acmr.com.cn/
環境安全資料庫
多倫多大學和平與衝突研究項目組維護,涉及發展中國家環境壓力與暴力衝突
http://www.library.utoronto.ca/pcs/database/libintro.htm
經濟數據(國際)EconData (International)
馬里蘭大學提供的國際性EconData時間序列資料庫。新用戶要先看資料庫說明。文件是PK壓縮格式。
http://www.inform.umd.edu/EdRes/Top.../International/
經濟數據(美國馬里蘭大學)EconData (University of Maryland)
可以下載大量的時間序列數據和查看數據的工具。也可以下載一些指令和工作論文。數據覆蓋了全球及美國經濟。數據文件用PKZip格式壓縮。
http://www.inform.umd.edu:8080/EdRe...a/Econdata.html
經濟數據和鏈接(美國加州大學Fresno分校)Econ Data Links (CAL State Fresno)
由美國加州大學Fresno分校建立。該站點提供了大量表格和統計數據,以及很多相關站點的鏈接,內容從收入、財富到貧困問題都有。
http://www.csufresno.edu/Economics/econ_EDL.htm
經濟學數據Economics Data
是WebEc的一部分。以良好的編排方式將數據和經濟學站點排列出來。可參見經濟學與計算網頁,上面提供了很多軟體鏈接。
http://www.helsinki.fi/WebEc/webecc8d.html
經濟學網路
這是一個內容非常豐富的資源中心,有大量美國和世界經濟與金融市場的在線圖表、經濟指南、每周經濟分析與簡評,以及指向其它資源的鏈接。所有文件都是PDF格式。由德國駐紐約Morgan Grenfell的首席經濟學家Ed Yardeni博士提供。

Home


聯儲經濟數據Federal Reserve Economic Data (FRED)
是美國聯邦儲備銀行聖路易斯分行提供的一種很出色的服務。再該站點上,除了有經濟研究方面的研究論文和工作論文以外,還提供了有價值的關於美國經濟各方面的當前和歷史數據。
http://www.stls.frb.org/fred/
聯合國數據信息(耶魯大學)Numeric Data for UN Information (Yale University)
上面有各種數值型數據的鏈接。由耶魯大學圖書館維護。
http://www.library.yale.edu/un/un2d.htm
聯合國統計年鑒Statistics Yearbook (UN)
主要包括統計數據和指標(如月度統計公報)、統計方法、統計源與參考工具等內容。註冊後可以在一段時間以內免費使用統計數據和指標,其它資源不需註冊。
http://www.un.org/Depts/unsd/mbsreg.htm
貿易和環境資料庫
搜集了幾百個貿易與環境的案例,按28種不同標準分類
http://www.american.edu/projects/mandala/TED/ted.htm
美國的貧困問題Poverty in the United States
該站點上提供了美國人口普查局前幾年的人口系列報告。可以估算在貧困線以下的美國居民、家庭和個人的情況。文件是PDF格式。
http://www.census.gov/hhes/www/poverty.html
美國家庭的貨幣收入Money Income in the United States
這是美國人口普查局的系列人口報告的調查數據。對美國的家庭和個人 經濟狀況的估計;包括年齡、種族、性別、地區、教育程度、收入情況、工作狀況等變數。文件為PDF格式。
http://www.census.gov/ftp/pub/hhes/www/incom.html
美國經濟指標與數據Economic Indicators and Data (via Census Bureau)
美國人口普查局的最新經濟指標。包括: 耐用消費品廠商的運輸和定貨;房屋起價;商品與服務的國際貿易;製造業和商業創新及銷售;製造業的出貨、技改和訂貨;月度批發貿易;月度零售貿易及月度時間序列數據。該站點上還有一個觀察當前美國經濟狀況的小冊子,每月出版。常設指標有:GNP、進出口、就業及收入、價格等。有圖表,可檢索。
http://www.census.gov/ftp/pub/indic...ww/indicat.html
美國歷史上的人口普查數據
提供了描述1790-1860年間美國經濟的數據。由哈佛大學維護
http://fisher.lib.virginia.edu/collections/stats/histcensus/
美國歷史上的人口普查數據瀏覽United States Historical Census Data Browser
該站點提供了描述1790-1860年間美國經濟的數據。由哈佛大學維護。
http://icg.harvard.edu/census/
美國明尼阿波利斯聯邦儲備銀行經濟研究和數據(聯機)Federal Reserve Banks (Online)
美國明尼阿波利斯聯邦儲備銀行經濟研究和數據,大量經濟數據可供查找。
http://woodrow.mpls.frb.fed.us/
美國統計(美國商業部)STAT USA ( Department of Commerce)
是美國商業部的一個站點。提供美國聯邦政府發布的商業、經濟、貿易活動的權威信息。站點上包括有嘗聯機服務的資料庫,也有一些免費的資料庫,如經濟分析局(Bureau of Economic Analysis Economic Information)、美國國家貿易數據銀行(the National Trade Data Bank)等提供的其它數據。
http://www.stat-usa.gov/
能源技術數據交換(ETDE)與能源資料庫
收集與交換能源研究與技術的信息,能源文獻收藏量為世界第一
http://www.etde.org/
日本統計Statistics in Japan
該站點提供了大量的關於日本的數據和指向其它統計站點的鏈接。由日本信息網路提供。
http://www.jinjapan.org/stat/
世界統計表格
世界統計表格是IMF的年度報告,由世界銀行出版,提供了世界各國經濟、社會數據指標集。
http://www.worldbank.org/html/extpb...NG/wdt-home.htm http://www.ciesin.org/IC/wbank/wtables.html
個人所得稅Statistics of Income: Individual Income Tax Returns
美國國家稅收局(Internal Revenue Service)關於個人稅收的年度報告。有稅收數量和總量,以及各種收入來源。
http://www.irs.ustreas.gov/tax_stats/ind.html
數據中華
商業數據網站,產業研究、競爭情報分析、市場調查、資信調查等
http://www.allchinadata.com/
統計資源指南Statistical Resources Guide
由Mansfield大學圖書館建立。超文本鏈接指向統計站點,或介紹印刷型資料。以美國為主,兼有國際性內容,內容涉及經濟、社會等各方面。是一個非常有用的資源指南。
http://www.clark.net/pub/lschank/web/govstats.html
網上數據(加州大學聖迭戈分校)Data on the Net (UC San Diego )
收集了關於美國經濟和其它數據的站點,有注釋,可檢索。
http://odwin.ucsd.edu/idata/
政府數據(NetEYE Inc)Government Data (NetEYE, Inc)
由商業服務機構streetEYE建立。全面收集了全球的數據資源。包括美國、加拿大、拉丁美洲、歐洲、遠東地區以及國際組織等。
http://www.streeteye.com/index/gov.html
中國產業經濟信息網
產業經濟的相關數據,部分內容可試用
http://www.cinic.org.cn/
中國導航網
中國導航網,專業的行業研究機構,權威的數據資源,覆蓋全國的調研機構,真誠的服務。
http://www.chinaguiding.cn
中國經濟信息網資料庫
中國經濟統計、行業、地區經濟、企業等資料庫
http://www.cei.gov.cn/default.aspx?tab=157
中國自然資料庫
中國資源、環境、人口、社會經濟等相關數據的集合。
http://www.naturalresources.csdb.cn/index.asp


十一、利用搜索引擎
1、http://scholar.google.com/
雖然還是Beta版,但個人已覺得現在已經是很好很強大了,Google學術搜索濾掉了普通搜索結果中大量的垃圾信息,排列出文章的不同版本以及被其它文章的引用次數。略顯不足的是,它搜索出來的結果沒有按照權威度(譬如影響因子、引用次數)依次排列,在中國搜索出來的,前幾頁可能大部分為中文的一些期刊的文章。
2、http://www.scirus.com
Scirus 是目前互聯網上最全面、綜合性最強的科技文獻搜索引擎之一,由Elsevier科學出版社開發,用於搜索期刊和專利,效果很不錯!Scirus覆蓋的學科 範圍包括:農業與生物學,天文學,生物科學,化學與化工,計算機科學,地球與行星科學,經濟、金融與管理科學,工程、能源與技術,環境科學,語言學,法 學,生命科學,材料科學,數學,醫學,神經系統科學,藥理學,物理學,心理學,社會與行為科學,社會學等。
3、http://www.base-search.net/
BASE是德國比勒費爾德(Bielefeld)大學圖書館開發的一個多學科的學術搜索引擎,提供對全球異構學術資源的集成檢索服務。它整合了德國比勒費爾德大學圖書館的圖書館目錄和大約160 個開放資源(超過200 萬個文檔)的數據。
4、http://www.vascoda.de/
Vascoda是一個交叉學科門戶網站的原型,它注重特定主題的聚合,集成了圖書館的收藏、文獻資料庫和附加的學術內容。
5、http://www.goole.com/
與google比較了一下發現,能搜索到一些google搜索不到的好東東 。它界面簡潔,功能強大,速度快,YAHOO、網易都採用了它的搜索技術。各位可以一試。
6、http://www.a9.com
Google在同一水平的搜索引擎。是http://Amazon.com推出的,Web result部分是基於Google的,所以保證和Google在同一水平,另外增加了Amazon的在書本內搜索的功能和個性化功能:主要是可以記錄你的搜索歷史。現在還是Beta,不過試用後感覺很好,向大家推薦一試 ,不過缺憾是現在書本內搜索沒有中文內容。7、http://www.ixquick.com
嚴格意義上講不是搜索引擎,是連接搜索引擎和網路用戶的信息立交橋。新一代的搜索引擎應運而生,Ixquick meta-search正是目前最具光芒的新星。但是對於大多數國內用戶來說,Ixquick還很陌生。Ixquick眾多獨特的功能我不一一介紹了,只 介紹我們最關心的,搜索資料庫密碼。
使用方法:先進入Ixquick,以「Proquest」資料庫為例。填入Proquest Username Password History Online後點擊search,看看出來的結果,第一頁中第6個,proquest的username和password赫然在目,別急,再看第4個結 果「HB Thompson Subscription Online Databases」,即http://homework.syosset.k12.ny.us/onlinedbs/HBTDatabases/,進入 後發現這是一個密碼頁,選擇Magazines Journals欄,就有 EBSCO、Electric Library Elementary、Electric Library Elementary、ProQuest Platinum (in school)、ProQuest Platinum (remote)等眾多資料庫的密碼,都有uesrname和password,隨便試一下EBSCO,OK,成功登陸。
8、http://vivisimo.com/
cmu的作品,對搜索的內容進行分類,這樣可以有效地做出選擇,比較有特色。可實現分類檢索,檢索速度也很好,如EBSCO 密碼幾分鐘就可找一大堆 .
http://search.epnet.com/,User ID: mountain,Password: ridge,這個密碼可以試試。
9、http://www.findarticles.com/
一個檢索免費paper的好工具。 進入網頁以後,可以看到他有三個功能,driectory web article ,其中article對我們很有幫助,你可以嘗試輸入你要找的文章,會有很多發現的!
10、http://www.sciseek.com/Sample
感覺不是很好用,內容也不是太多,主要靠用戶添加網址,提供信息的搜索引擎,搜索功能也比較差,輸入常見的關鍵詞,往往找不到相匹配的內容。
11、http://www.chmoogle.com
現點擊後或跳轉到http://www.emolecules.com,在此搜索引擎里可以搜索到超過千萬種化學品信息或相應的供應商,與Chemblink有點相似,但提供的化學品理化信息沒有Chemblink詳細,與其不同的是該搜索引擎可提供化學品結構式搜索(主頁上有在線繪製化學結構式的搜索框)。
12、http://www.ojose.com/
OJOSE (Online JournalSearch Engine,在線期刊搜索引擎)是一個強大的免費科學搜索引擎,通過OJOSE,你能查找、下載或購買到近60個資料庫的資源。但是感覺操作比較複雜。
13、http://citeseer.ist.psu.edu/
一個關於計算機和信息科學的搜索引擎。
14、http://hpsearch.uni-trier.de/
專家個人主頁搜索引擎
15、http://cnplinker.cnpeak.com/
為 了給讀者用戶提供一個方便快捷的查閱國外各類期刊文獻的綜合網路平台,中圖公司組織開發了cnpLINKer(cnpiec LINK service)在線資料庫檢索系統,並正式開通運行。cnpLINKer即「中圖鏈接服務」,目前主要提供約3600種國外期刊的目次和文摘的查詢檢 索、電子全文鏈接及期刊國內館藏查詢功能.並時時與國外出版社保持數據內容的一致性和最新性。點評:只提供了外文檢索的功能,但是無法得到全文。個人認為不是很理想。
16、http://guoxue.baidu.com/
百度國學目前能提供上起先秦、下至清末歷代文化典籍的檢索和閱讀。內容涉及經、史、子、集各部。
17、http://infomine.ucr.edu/
NFOMIN是由加州大學、維克森林大學、加州國立大學、底特律大學等大學圖書管理員建立的學術搜索引擎。它主要為大學職員、學生和研究人員提供在線學術資源。


十二、互聯網和傳媒
1、資訊類
新浪科技 http://tech.sina.com.cn/
騰訊科技 http://tech.qq.com/
艾瑞網 http://www.iresearch.cn/
藝恩網 http://www.entgroup.cn/
虎嗅網 http://wwww.huxiu.com/
36kr http://36kr.com/
鈦媒體 http://www.tmtpost.com/
遊戲大觀 http://www.gamelook.com.cn/
億歐網 http://www.iyiou.com/
媒介360 http://www.chinamedia360.com/main
2、數據類
中國票房 http://www.cbooo.cn/
中國互聯網路信息中心 http://www.cnnic.net.cn/
艾瑞網 http://www.iresearch.com.cn/report/viewlist.aspx
易觀智庫 http://www.analysys.cn/
遊戲產業網 http://www.cgigc.com.cn/list/79644663134.html
百度指數 http://index.baidu.com/
大數據導航 http://hao.199it.com/
CSM(電視收視率) http://www.csm.com.cn/
微排片 http://www.weipaipian.com


十三、醫藥行業
1、樣本醫院數據
(1)化葯、生物葯和中藥注射劑 http://pdb.pharmadl.com/
(2)中成藥、化葯 http://www.menet.com.cn/
(3)國外樣本醫院數據彭博上有類似PDB的資料庫
2、藥品中標價格
百度蟲,葯智網,健康網 (付費),米內網(付費)
3、藥品招標政策
各省藥品招標平台
4、醫療器械數據
基本沒有,米內網有付費資料庫(沒見過)、海關信息網
5、中藥材數據
中藥材天地網、萬得的EDB、中藥材東方網
6、藥品審批
葯智網、葯監局、CDE網站
7、醫藥行業政策
國家葯監局、發改委、中國政府網、衛計委等等
8、國內外行業協會和諮詢機構
例IMS Health、XX醫藥協會
9、新聞網站/微信
賽柏藍、米內網、生物谷、新康界、醫谷、葯友匯、丁香園、動脈網、貝殼社


十四、策略常用網站
1、國內網站
統計局 www.stats.gov.cn/
中國人民銀行 www.pbc.gov.cn/
財政部 www.mof.gov.cn/
海關總署 http://www.customs.gov.cn/tabid/400/Default.aspx
中央結算公司 www.chinabond.com.cn/
發改委 www.sdpc.gov.cn/
審計署 www.audit.gov.cn/
2、國外網站
the world bank: http://www.worldbank.org/
united states census:http://www.icpsr.umich.edu/
BEA: http://www.bea.gov/
CBO: http: //http://www.cbo.gov/
world federation of exchanges: http://www.world-exchanges.org/
最常用wind股票資料庫


十五、銀行業
1、新聞資訊
中證網 http://www.cs.com.cn/xwzx/hg/
一財網 http://www.yicai.com/economy/
財新網 http://finance.caixin.com/bank/
華爾街見聞 http://wallstreetcn.com/news?cid=19
新浪財經 http://finance.sina.com.cn/
證券時報網 http://www.stcn.com/
中國金融新聞網 http://www.financialnews.com.cn/yh/xw/
2、公告、數據查找
中國貨幣網 http://www.chinamoney.com.cn/index.html
巨潮網 http://www.cninfo.com.cn/
統計局 www.stats.gov.cn/
中國人民銀行 www.pbc.gov.cn/
銀監會 http://www.cbrc.gov.cn/index.html
上海證券交易所 www.sse.com.cn/
深圳證券交易所 www.szse.cn/
最常用wind股票資料庫


十六、有色金屬行業
1、日報網站
(1)宏觀新聞:央行快訊 http://t.news.fx168.com/bank/
(2)行業新聞:中國金屬網 http://www.metalchina.com,上海有色網 http://www.smm.cn/index_2015.html,百川諮詢 http://www.baiinfo.com
(3)公司公告:巨潮 http://www.cninfo.com.cn
2、其他常用站
高工鋰電 http://www.gg-lb.com/default_index_new.php
真鋰研究 http://www.realli.net
深交所互動易(查看投資者互動資料) http://irm.cninfo.com.cn/szse/
中金網(有色金屬) http://www.metalsinfo.com/news/
銀 https://www.silverinstitute.org/site/publications/
銀 http://financial.thomsonreuters. ... /articles/gfms.html
新三板咨訊 http://www.sanban18.com
格隆匯港股 http://www.gelonghui.com/portal.php


十七、英語技能建議
1、總結: 聽,讀/複述,記錄三者缺一不可


FT商學院 http://www.ftchinese.com/channel/mba.html

FT雙語閱讀 http://www.ftchinese.com/channel/english.html


FT英語速讀測試 http://www.ftchinese.com/channel ... utm_medium=referral


2、推薦材料和網站


最實用的聽力網站:http://www.hxen.com/englishlistening/


頁面上方有這麼多的選項,可以根據自己的水平選擇不同的聽力材料,很多材料都有文本甚至有中文翻譯,是非常難得的資料! 每天花15分鐘,選2-3篇新聞練聽力,對照文本和翻譯,並把實用的內容記錄下來,非常有幫助。


提示: VOA慢速:速度非常慢,屬於難得最低的材料。VOA標準:常速新聞,難度中等。BBC:標準英式發音,難度較大。NPR: 速度較快,難度較高的美國廣播新聞。


十八、培養market sense的幾個必備網站
1、新浪財經


國內最全面,最權威的財經網站,設為瀏覽器主頁,http://finance.sina.com.cn/,各個欄目的質量都很高,有很多值得挖掘的內容


絕對的國內財經頭條,其中右方的專題策劃非常值得一看


主頁下方很多國內權威雜誌的鏈接,可以免費閱讀

2、21世紀商業評論


http://www.21cbr.com/ 最前沿的商業資訊,文章很有深度,可訂閱電子郵件


3、FT中文網


http://www.ftchinese.com/,權威,可同時讀中英文文章,可訂閱電子郵件


4、華爾街中文網


http://cn.wsj.com/gb/ 同樣權威,可同時讀中英文文章,可訂閱電子郵件


5、推薦網站視頻:


羅輯思維,贏在中國(經典的創業節目),中國經營者,CCTV-2 經濟半小時,一虎一席談,財富人生。


我主要針對題主提的問題回答吧,拋磚引玉。看了其它知友的回答,關於數據網站方面的內容都挺全面的(不過居然看到了VOA英語和邏輯思維等是怎麼回事)。

一、

找到了數據,卻無法溯源,而數據不能使用的時候?
數據說法不一,而沒有一個官方的來源,無法抉擇的時候?

這兩個問題有些類似,都是需要找到一個官方的來源。

股票基本面財務數據:
當然最正統的來源是上市公司的年報:
上交所:上海證券交易所
深交所:深圳證券交易所
港股:http://www.hkex.com.hk/chi/index_c.htm
美股:SEC.gov | Home
更方便獲取年報的網站應該是巨潮資訊網,當然單間公司也可以到公司的官網去下載。一般上市公司網站都有相關欄目。一般叫「投資者關係」。

官方經濟數據:
統計局:中華人民共和國國家統計局
美聯儲:Board of Governors of the Federal Reserve System

石油:
OPEC:OPEC : Home
(OPEC每月都會發布月度報告,這也是很多新聞的來源)
倫敦貴金屬交易所:London Metal Exchange: Home(倫敦金等)

外匯:
國家外匯管理局:http://www.safe.gov.cn/
等等。有太多了,由於前面很多答主已經列舉了很多來源,所以就不再花時間堆鏈接了,都大同小異。

方法:
主要說說一下個人找來源的簡單方法,姑且叫它「關鍵字溯源法」吧。
其實就是從財經新聞中尋找那些關鍵字,然後在搜索引擎上尋找它的網站。除去一些偽相關等無意義的財經新聞外,一些新聞是由專業的財經記者寫的,一些是引用一些業內著名人士的分析的,還有一些則是翻譯外國的一些文件或新聞。在這些新聞內容中,多多少少會有一些機構組織名稱(通常是英文名)是容易被我們忽視的,而這些恰恰是關鍵信息來源,甚至比你看的新聞更加客觀。
這是一個很久以前的可能不起眼的新聞,以它為例子:
2014年全球十大黃金生產商排名

文中列出了十大黃金礦商的產量(這裡暫且不論新聞的真實性,如果需要驗證的話,可以到相應國家的股市上看或在Google上查詢一下,再嚴格點可以深入各個公司的年報細看。),這裡提供了大量的信息:
1.十大黃金礦商的名稱;
2.數據來源(左下角GFMS)。

搜索一下GFMS(外國網站當然用Google。雖然即使是中文也比百度滿屏廣告要好。):

於是我們得知了它是全球領先的貴金屬諮詢公司,如果還不放心數據的真實性(畢竟這是二手數據了),我們可以直接搜索公司的名稱,年報是最標準不過的了。

比如搜索Goldcorp,進入其官網下載年報打開,所有的信息一目了然(外國的年報做得很精美)。

在這幾百頁的PDF里,你看到的就不僅是產量這麼簡單了。包括維持成本(All-in sustaining costs)等等。你也可以對它們進行整合得出數據:

如果對大宗商品感興趣,從這方面入手也是一個切入點,也可以看看外國企業開採黃金的成本等等。可以作出一些調研分析。對於行研有一定的幫助。

如果你對看到的新聞追根溯源,能夠發現很多對分析有用的東西,比如
美國能源署EIA2015展望(現在應該2016了吧。)

2015世界風險報告

等等有意思的文件。

還有很多的東西可以去挖掘。


二、

有些數據就是找不到,不知道如何闡述某個問題的時候?

有些數據的確是找不到的,這時候就需要自己預測了。最常用的方法就是利用計量經濟學的方法建立經濟模型,根據已知的因素進行線性回歸分析,進一步去預測某些數據。

之前見過一個人,在投行工作期間研究高速公路上市公司,需要未來幾年計劃鋪設的公里數,有些政府網站會提供相關數據,但是有些政府網站並沒有提供,網上也沒有任何相關數據。最終他根據幾個已知的數據,比如歷史鋪設的公里數、GDP增長率等等自己建立了一個經濟模型進行預測,結果據說還挺準確的。

比較常用的統計軟體就是SPSS、R這些了吧。涉及到的具體問題比較複雜,也需要根據具體問題來分析。


三、

有些數據明明就有,卻來自於某些諮詢公司,標價動不動就是上千刀!

現有的資料庫往往太貴,一般人承受不起。所以當一些數據可以從網頁上獲取得到,卻沒有相應的介面時,就需要用爬蟲了。

1.Excel(相信很多人都會,不了解的可以看看)
Excel可以選擇複製粘貼的方式,但效率較低,且無法更新。所以在Excel中調用數據是更為明智的做法。

優點:簡單快捷,不需要太多的計算機知識;數據能夠自動更新。
缺點:不使用大規模爬取數據;效率較低。

具體做法是:
在網上找到想要的表格數據

複製網站,打開Excel,選擇數據-自網站

在彈出框的地址欄中輸入網址,進去後,在需要的表格左上方會有黃色的框黑色的箭頭,點擊便是選中表格。

選中後點擊導入就可以了。

2.爬蟲+資料庫(構建自己的資料庫)
上面的Excel算個「小爬蟲」了。但真正高效的還是得用程序編寫。個人使用的是Python+MongoDB,當然使用其它的組合也可以。

優點:可以大規模的獲取數據;效率高;可以構建個性化的資料庫。
缺點:需要學習編程;可能面臨反爬蟲的問題等。

以我前幾天做的舉個例子,想要求出A股所有上市公司的資本回報率(Return of Invested Capital ,ROIC),無奈它不是一個會計科目,也不是常用的財務指標,沒發現有網站提供這個信息(提供了其實也得用爬蟲,尋找的時間成本也高),所以需要自己計算。而完整的財務報表也沒有免費的API提供,只有一些網頁提供了。所以最終我寫了爬蟲爬了約5000個網站,搜集了約100000條的財務數據把它算出來了。

具體做法是:
(1)寫出爬蟲,將信息爬取下來。
具體對應的庫:
網頁操作:

urllib:https://pypi.python.org/pypi/urllib3
requests:Requests: HTTP for Humans

爬蟲及爬蟲框架:

BeautifulSoup:Beautiful Soup Documentation
lxml:The lxml.etree Tutorial
scrapy:Scrapy入門教程
pyspider:pyspider

(2)將數據寫入資料庫中(調用方便快捷,可重複利用)。
資料庫:

pymongo:PyMongo 3.2.2 Documentation
sqlite3:11.13. sqlite3 a€」 DB-API 2.0 interface for SQLite databases
MySQLdb:GitHub - farcepest/MySQLdb1: MySQL database connector for Python (legacy version)

(3)從資料庫調出並作計算。
科學計算:
numpy:NumPy — Numpy
pandas:Python Data Analysis Library
scipy:SciPy.org — SciPy.org

(4)數據可視化。
畫圖:

matplotlib:http://www.labri.fr/perso/nrougier/teaching/matplotlib/

同時pandas也能夠畫圖
(有時二三步也可調換,先計算好後將計算結果寫入資料庫。)

通過該種方法,就可以在各個網站上將需要的數據(可獲取的或不可獲取的)放進自己的資料庫,下次需要調用的時候就可以輕易調用了。對於一次性的數據,甚至不用寫入資料庫,調用一遍並進行計算就可以得到想要的數據了。對於研究相關領域有很大用處。


作為互聯網營銷策劃,經常需要查詢一些數據來完善方案邏輯,因此整理了一些數據網站,分享給大家。

主要為互聯網數據和一些傳統數據的查詢,主要包括:

1. 互聯網部分:移動端數據(微信、微博、APP),網站數據,綜合數據,票房和電視收視率,視頻指數,內容數據

2. 傳統數據部分:經濟數據,企業數據,金融數據,汽車數據,建築數據,醫療數據,服裝數據,建築數據

只涉及數據查詢不涉及報告下載,至於下載數據報告網站(看點贊情況再分享吧),用完這些網站,如果還有什麼數據查不到,私信我,再分享一些網站給你查(我就說說別當真/調皮)

特地將數據網站整理為書籤,點擊此鏈接將書籤直接導入:https://pan.baidu.com/s/1nvSBeBn

一、移動端數據

l 微信數據(營銷老是要分析一些KOL和自媒體)

1. 排名列表_日榜

2. 新媒體指數

3. 微問數據_微信公眾號分析

4. 微榜 | 愛微幫新媒體榜 Beta

5. simplyKOL微信數據

6. 微指數_微信大數據領導者_微信文章_微信營銷_微信公眾賬號大全_微信排行榜

7. 微信公眾平台導航_微信公眾賬號大全

8. 可查90數據-易贊 (部分數據配合數據透視,有更多驚喜)

l 微博數據(寶強過後微博又開始紅了一段時間)

1. 知微傳播分析-WeiboReach

2. 微博認證-名人堂

3. 發現-熱門微博

4. 微風雲_微博風雲榜

5. 數據首頁-微博數據中心-新浪微博

l APP數據(幫幾家金融機構的APP,做過推廣和優化,所以收藏了一些網站)

1. 熱門蘋果應用搜索 只查IOS

2. App Annie App Store Stats | iOS熱門 App 排行榜 中國 - 所有類別 只查IOS

3. 應用雷達-iOS深度移動推廣運營服務平台|蘋果APP排名搜索優化統計分析 只查IOS

4. 友盟指數 - 最專業的移動互聯網行業發展趨勢指數

5. 首頁-應用排名分析平台-愛盈利

6. ASO100 - 中國最專業的 App Store 排名、ASO 數據平台

7. App競品大數據平台_App運營、ASO優化必上APPDUU

8. APP宏觀數據—友盟指數 - 最專業的移動互聯網行業發展趨勢指數

9. 應用排名分析平台-愛盈利

10. APP排名查詢-易觀千帆(數據比較詳細,可惜只能免費查三天)

11. 安卓IOS APP數據-酷傳 - 添加應用 安卓和IOS都可以查

二、網站權重和數據(網站SEO和SEM不太懂,但是有一家很牛的供應商,主要做中間商,整理方案)營銷的時候,SEO和輿情更配

1. Alexa網站排名查詢

2. 中國站長站

3. 站長工具-百度權重排名查詢-站長seo查詢 - 愛站網

4. 網站排名_網站數據流量查詢_中國網站排名_網路媒體精品推薦

5. 友情鏈接—友情鏈接查詢|友情鏈接檢查工具-站長幫手網

6. PR真假—PR查詢|PR真假查詢|PR劫持檢測-站長幫手網

7. 友情鏈接交換—go9go友情鏈接平台--想鏈就鏈go9go

8. 行業網站排名_行業網站排行榜_行業網站大全 - 網站排行榜

三、綜合指數(寫傳播結案和分析客戶傳播節奏的時候用)

1. 百度指數

2. 搜狗指數

3. Google 趨勢

4. 好搜指數-搜索大數據分享平台

5. 微指數首頁

6. 熱搜榜單首頁--百度搜索風雲榜

7. 艾曼指數首頁

8. 淘寶指數 - 淘寶消費者數據研究平台(已經沒有了,以前很好用)

9. 阿里指數 - 社會化大數據分析平台(必須要開過淘寶店的賬號,更可氣的是只能查詢單一行業)

10. 阿里指數_最權威專業的行業價格、供應、採購趨勢分析(這個就能完美解決上面的問題)

四、票房和電視收視率(額……為什麼有這些網站,才不會告訴別人,是因為我喜歡看電影)

1. 中國票房

2. 電視收視率—CSM

3. 貓眼票房分析

4. 精選預告片 - 預告片世界

五、視頻指數(近期想切入視頻IP市場的推廣,也就是想想)

1. 搜庫-專找視頻

2. 騰訊視頻指數

3. 中國網路視頻指數 – 網路視頻收視數據分析平台

4. 優酷指數 - 中國第一視頻網,提供視頻播放,視頻發布,視頻搜索

5. 搜狐視頻指數中心 - 搜狐視頻

6. 愛奇藝指數

六、內容排行(這個網站偶爾看一下熱點吧,用的比較少)

1. 網評排行-搜狐

一、經濟數據

1. 人民銀行

2. 國家數據

3. 中國銀行業監督管理委員會

4. 中國統計信息網

5. 統計數據

6. 中華人民共和國國家統計局 統計數據

7. 專項統計數據-中國證券業協會

8. 居民消費價格指數(CPI) _ 數據中心 _ 東方財富網

二、企業數據(有時候接到一些Brief,大部分客戶不靠譜,可能會問候一下他企業背景)

1. 全國企業信用信息公示系統 (官方出品)

2. 企業信息—天眼查-最專業的企業工商信息查詢(這個比官方的好用)

3. 企業名錄-企業黃頁_必途網企業黃頁大全

4. 企業信用查詢_企業信用報告查詢系統_註冊信息查詢網-信用視界

三、金融數據

l 網貸數據(去年P2P,不,是互聯網金融很火的)

1. 金匯金融__平台指數_P2P網貸平台評級_網貸315

2. 【p2p網貸平台排名】最新網貸平台排名_網路借貸平台排名_網路貸款平台排名-網貸之家

3. 平台報告-零壹數據

4. 上海貸款_小額貸款_貸款公司_銀行貸款 - 融360

5. 平台指數_P2P網貸平台評級_網貸315

6. 新金網 - 最專業的互聯網金融導航網站

7. P2P網貸平台數據排行對比_網貸平台數據_網貸天眼

8. p2p排行榜,網路理財排行榜,第三方p2p平台排行榜 - 76676-最大的投資理財產品點評平台

l 上市公司年報(竟然為了分析社媒趨勢去看BAT的年報,表示看不懂呀)

1. 中國—巨潮資訊網

2. 美國—SEC.gov | Company Search Page

3. 香港—:: HKEx :: HKExnews ::

l 信託(信託切入互聯網金融相對較慢,今年剛開始接觸的幾個客戶)

1. 研究報告 - 中國信託業協會

2. 中國互聯網金融研究中心 中國互聯網金融網 中國互聯網金融聯盟 中國電子商務研究中心

l 其他

1. 案例報告列表_融資案例_併購案例_行業案例_企業案例_數據_分析—投資潮

2. 融資數據—融資事件列表頁 | IT桔子

3. 研究院_ChinaVenture投資中國網

4. 百度財富-專業金融服務平台

5. 世界銀行-Data | The World Bank

6. 全球股市指數

7. 股指期貨數據

四、汽車數據(有一個汽車配件的客戶,講真,汽車客戶真的比金融客戶前期好搞,不過後期服務就呵呵了)

1. 數據中心 世界汽車統計 中國汽車工業協會

五、建築數據(我也不知道為什麼有這個網站)

中華人民共和國住房和城鄉建設部 - 單位資質查詢

六、醫療數據

1. 世界衛生組織 | 規劃和項目

七、服裝數據(才不會告訴你,我是學國際經濟與貿易出身的,後來才做了互聯網營銷策劃,其中有一萬隻羊駝在奔跑)

1. 中國皮革原材料指數

2. 海寧周價格指數

3. 中國柯橋紡織指數

4. 大朗毛織價格指數

八、工業指數

1. 今日國際原油價格,原油價格走勢圖,原油價格指數-油價網

2. 上海有色金屬價格指數

3. 水泥指數

其他數據

1. 中國統計信息服務中心 口碑查詢

2. 最具公信力的名人影響力指標 - 必應 影響力

3. 全部榜單--百度搜索風雲榜

4. 百度預測-大數據 知天下

l 原始數據-數據淘(這個網站聽說可以買到原始數據,不過沒有試過)

這些網站還不錯,數據也算可以,其他的數據網站沒有分享了。這只是網站,具體用法太多了,就沒有分享單個教程。強調:網站用的好,真的能用出花來,比如百度指數+百度新聞=客戶和競品的傳播節奏。具體網站的功能多試試,不要執著於網站,要多變通思路,希望能找到想要的數據(說服力)。


做投行、行研、諮詢等金融崗位,有沒有什麼好用的找數據技巧呢?

排名第1 何明科 的回答,7000多個贊,令人羨慕。
但我感覺不是給金融崗位從業者回答的,而是給大數據行業回答的。

何文的解答很好,但若用在金融上,好像還沒看到成功實例。
好的金融如藝術,何文解答的辦法若是成功了,我的感覺如上圖。

首先,我的態度是問題導向,結果導向。
金融投資最後是看結果,用數據寫出來的報告如果形式上很漂亮,但應用的投資結果是失敗的,那也是失敗的。不知道提問者是否同意?

不好意思,耽擱好久了。前幾天被大洪水的science論文搞去,一直沒有續,抱歉。

我2000年讀企管專業博士,交大班上一半同學是在職博士,有上交所施東輝,發行部的某某,有上市公司的高管,有金融機構的。。。。。
施東輝:量化投資將迎來蓬勃發展時期
那時候涉及到數據問題就是如何找到合適數據做相應研究。
要知道,2000年,上海交通大學校內都要通過代理才能出國。數據當時有年鑒書,統計資料等,但數量上遠遠少於現在。

當時,我們在陸家嘴的一家知名金融機構實習,直接面臨著如何利用金融數據做課題的問題。
我現在無法說出當時機構名稱,但這機構下招聘的員工是上海top 2 的博士碩士,其中有江蘇省97年文科狀元。當時我們研究了一系列課題(包括資產證券化,作者後面在證監會做過博後)。

在機構做金融數據研究,有個好處就是一般機構都擁有金融資料庫。
好了,當時有好幾家我們機構買了一家(我忘了是哪家,當時有國研、巨靈信息、wind萬德等),那時候我們就從上面下載一些機構的行業分析報告,作相應的研究。

不過那時候,研報少,很多券商不養分析師。很多名詞我們都不知道怎麼翻譯,比如UBS來講風險管理,那份材料是我翻譯成中文。

因為我們還是在校的學生,所以研究偏重於

待續

歡迎參加live PE行業之我見
入口
PE 行業發展之我見(案例篇)知乎live - 惟適之安 - 知乎專欄


看了樓上的回復還是想出來給大家揭示一下這個問題,鑒於圈外太多人對此行業的膜拜和熱情似乎超出理智範疇,其實不過是不了解和出於對於金錢的熱衷,恕小弟見識淺顯,就目前工作經驗來看,以後的大數據管理大致分為兩個方向,一個數據處理,一個編程開發,後者是有別於前者的,這個待會兒再說,為什麼我不說數據獲取?因為現如今只要稍微上了點規模的企業在獲取數據方面幾乎都不成問題,內部數據有自己專門的技術部開發系統,差一點的買系統做成數據源報表,外部數據即使找不到就乾脆直接花錢買,保質保量。
好了,先說第一個,數據處理,這個就目前所知及以上內容,就是VBA,這東西跟普通的編程不太一樣,因為平台當下大部分情況下還是限於Office ,這東西吊不弔?確實吊,幹什麼的,用比較職業的語言說是把數據處理工作當中的手工處理環節通過編程的方式精簡或者省略,達到一步獲取處理結果,也就是相應的報表,這麼說估計圈兒外人聽不懂,那我就打個比方說,就是你有近幾個年度公司里每項商品的進貨價,銷售價,毛利率,凈利率,銷售費用等一大堆數據,但是突然領導要你把幾家分公司在某幾個商品的銷售凈利率成長拿出來比較一下,看看局部市場對這個產品的反應和銷售效率,要是以前,你可能要留下來加班搞了,因為有一大堆亂七八糟的excel 公式等著你,更可氣的是今天是周五,而且眉來眼去了許久的妹子正在樓下的咖啡館等著你下班,可是現在是21世紀了,你不用了,因為你有了VBA,在設定好程序以後,幾秒鐘就可以拿到報表交差,所以,這玩意兒真是好真是妙,真是呱呱叫,於是你不用加班了,於是會編程的大牛不再是會編程的大牛,成了傳說中的牛B,但是,少年,任何事情都有個殘酷的但是,這件事情你完成的很漂亮,可是別忘了為什麼要做,對,只是領導要你做,只是領導想看一下這張報表。這東西很牛逼,但也絕不是不可替代的,即使是程序員,滿大街都是,所以再牛逼也只是個生產工具,學好了絕B可以像酒量好一樣獨樹一幟,可是為什麼這東西就可以走出公司成立專門的機構向外面接活兒?為什麼酒量好就不能成立專門的公司?公布正確答案,因為LOW 。
所以,我一直都說,時代變了,搬磚的方式更多元化了,以前是戴手套頂鋼盔,現在是坐在電腦前碼字,時代也沒變,民工還是那個民工。這種冷酷吊的行業披著租來的阿瑪尼,但光鮮背後永遠是更多的辛酸,看看那些華爾街的白富美高帥富們一看到中國富豪就恨不得馬上俯身獻菊的表情我想你已經略知一二。
扯遠了,現在說第二點,就是編程開發,現在真正牛逼的公司管理已經不是過去的公司管理了,靠什麼?對,靠編程!梳理公司內人員工作流程,然後用編程的方式開發成系統,讓大家都用這個系統來辦公,這樣做有兩個目的,一個是防止出錯的同時加快效率,另一個是系統可以將公司每項運作記錄下來形成數據,也就是前面所說的獲取數據,都說到這裡了,已經很明顯了,生產線還是那個生產線,螺絲釘還是那個螺絲釘,現代社會的發展為了提高效率,除了公司外部,公司內部也會做專業化分工,這就是為什麼很多朋友在一家公司幹了很多年覺得其他的行業似乎都幹不了了,也就是為什麼要做輪崗的原因。不過話說回來,這東西確實強大,會編程搞系統確實很重要,但是,我要說的是,真正牛逼的人不是這些搞系統的,而是提開發需求的,系統你不願意搞市場上大把,為什麼提需求的更牛逼?因為能提需求說明業務在發展,在擴大有錢賺進而產生了這樣的管理訴求,所以馬克思主義哲學教育我們,要能從局部看到全部,不要做生產線上的螺絲釘,要做就做最牛逼的那群人。又TM扯遠了。
寫這些東西不是想誠心擠兌或埋汰誰,別理解錯意思喲,只想避免更多的年輕人在不明就理,僅憑藉大牛的煽風點火就一畏拋頭顱灑熱血,最後發現只落得一場空的遺憾。因為當年自己確實也是這麼過來的。來到這個行業後才發現,錢確實多,可都是別人的。


讓你們老闆給你們訂彭博終端(bloomberg terminal)


數據首選中國統計局網站啊,別管數據信不信,那是官方數據啊。
其次是中國產業網,數據非常全,還有圖表,有個別免費報告。
金融數據,上市公司和行業數據可以找wind等軟體。
再就是各個子行業自己的網站。
一些投行和諮詢公司發的免費報告有些提綱要領的內容,但是詳細內容必然是花錢的。
多百度關鍵詞,能發現很多有用的網站。
PS,這些的確主要扔給實習生和商業分析師做,但是只是輔助。


看懂均線,對於判斷股價走勢作用明顯,老股民都知道參考均線來操作,尤其是一些均線的特殊形態可以看做買入、賣出的信號。

1、均線拐點:

均線拐點是指在某個點後,均線開始向相反方向運動。如果在均線拐點處,股價在均線上,且K線方向與均線拐點後的方向相同,則股價沿該均線方向運動的概率大。

2、均線貼合:

均線貼合的形態一般出現在股價震蕩階段。當均線出現這種形態,投資者一定要等到均線方向明確後再操作。如果均線貼合後發散向上,則做多,否則應觀望或賣出。有時候,均線貼合形態會持續較久,投資者需要耐心等待。

3、股價穿越均線:

短線操作參考5日均線

5日均線對做短線的投資者幫助效果明顯,用3日均線會過於敏感,而用十日均線則太過遲鈍,所以,5日均線是短線最好的工具。一般來說,強勢股會以5日均線作為支撐,沿著5日均線上漲,所以,股價穿越5日均線時,投資者可儘快買入。而弱勢股則以5日均線為阻力線,沿5日均線下跌,股價跌破5日均線應儘快賣出。如下圖,綠色線為5日均線:

10日、60日均線的買入信號

5日均線適合短線投資者參考,而10日、60日均線則適合長線投資者。

在K線圖上,當股價向上穿過10日線,可作為買入點,如果此時30日均線、60日均線也同樣呈現出向上趨勢,那麼此時的買入信號更可靠。如下圖所示,股價向上穿過10日均線是買入時機,但當股價上漲遇到60日均線上不去時,應當及時止盈出場。

10日、60日均線的賣出信號

當K線圖上出現10日均線趨勢向下,可看做短期的賣出信號,當股價跌破10日均線時,則必須賣出。如果此時K線圖上30日均線、60日均線趨勢均向下,那麼賣出信號就更為可靠。如下圖中,個股經過頂部短期震蕩後,開始下行,此時10日均線趨勢向下,應當賣出。而隨後股價跌破60日均線,這已是最後的賣出機會,投資者千萬不能再錯過,因為當股價跌破60日均線後,下跌勢能增強,股價一路下行。

本文由本人原創內容,暫不支持轉載,僅對新手股民做參考建議,不懂手中個股如何操作的新手股民可以觀看筆者主頁簡介,關注筆者,筆者願意用綿薄之力祝你在股市少走彎路!


現在感覺爬蟲逐漸會成為一種基礎服務,推薦大家可以關注一下知乎專欄:數據工廠 - 知乎專欄。裡面已經將寫爬蟲基礎化,看完誰都會寫爬蟲了。


為毛沒人推薦萬得?Wind簡直查指標神器…


這個問題跟我的個人經歷還是非常匹配的,先自我介紹一下:
我曾任職於morningstar(晨星資訊),負責morningstar(晨星資訊)全球金融大數據的收集和分析平台。曾在芝加哥(Morningstar全球總部)工作,在矽谷培訓學習,對全球大數據產業發展有深入研究。

金融行業其實是一個很傳統的行業,當然也是對數據依賴非常大的一個行業,晨星當時我在職的時候大約全球2萬名員工,其中有數千的員工從事的就是全球金融數據額收集工作。簡單總結一下數據獲取的幾種方式:

1. 從專業金融公司購買數據
晨星,wind,彭博,穆迪等專業的數據服務公司有各種數據輸出介面服務,以及各種終端,涵蓋了幾乎絕大部分的金融行業數據。當然這類服務一般價格昂貴,優點是數據質量確實不錯,而且數據都是經過了校驗和人工清洗的。一般都可以直接拿來用。

2. 從通用數據資源共享交易平台免費下載
除了以上專業的金融數據平台,還有第二類通用數據平台,比如「數多多」平台,這個就是類似天貓一樣的數據交易平台,與天貓不同的是上面交易的全都是數據,目前數多多平台有數千專業的數據供應商,另外,還有個很大的優點,上面大部分的數據都是免費的,也就是說完全不用花錢就可以下載各行各業的數據,數據一般都是經過整理的格式化數據。也完全可以直接使用。收費下載的數據價格也很便宜,並且數多多平台提供了擔保交易機制,如果數據包有問題,還可以退款。

3. 使用專業數據採集軟體採集數據:
如果你想實時監測互聯網財經媒體,得到最新財經資訊及全球金融市場報價,分析股票的走向與趨勢。最新的股票名稱、價格、跌漲幅、成交量、成交額、價格比等信息,而這些數據一般都在一些財經媒體比如東方財富,雪球財經,新浪財經等網站上的話,那麼使用專業的網頁採集工具比如八爪魚採集器,就可以輕鬆達到目的,當然市面上有很多採集軟體,八爪魚的優點在於免費、傻瓜化一鍵式採集,導出excel,資料庫等各種格式,並且能通吃各種網站。下面這個截圖就是我採集東方財富網的金融數據的一個截圖。

4. 加入各種專業的數據圈子和群組共享數據:
有一些專業的圈子裡面經常分享各類數據,這些私下分享的數據一般來自公司內部數據,或者付費平台的導出數據,從其他渠道很難獲取,比如我就曾今加入幾個分享一手簡曆數據和汽車銷售數據的群,但是也要注意防止被騙,同時也不能只索取數據而不共享給別人。

5. 通過調查問卷等獲取數據
一些第三方問卷平台,比如問卷網等提供了方便的方式,可以快速製作各類問卷,然後只要有個很好的話題在微信朋友圈等傳播,或者設置抽獎,很快就可以收集非常多的問卷數據,此類問卷平台一半後台都有數據可視化分析報告,這個技巧大部分人都不用,其實操作起來不難。

真正的數據高手一般都不僅僅通過單一的渠道獲取數據,而是會綜合各種渠道的數據,整合利用,但是不同的數據渠道,有不同的數據質量,綜合利用的時候要主要評估數據的來源,可靠程度,全面性,最後還有點,如果你需要持續的數據支持,必須考慮數據如何更新,如何實現自動化等。

最後希望大家都找到自己想要的數據,好的數據多多分享。


如果想不花錢的話。研報上microbell,是可以免費下載的,包括行業研報和個股研報,時間最最長是一年內。
如果是新股,IPO報告會覆蓋行業分析。
沒事看看年報,也會有行業數據。


雖然只短暫的在甲乙方的行研部門實習工作過,但還是想和題主以及上面的各位答主分享一下我的想法。我認為問題描述中的三「有些數據就是找不到,不知道如何闡述某個問題的時候?」其實隱隱透露出了真實問題的所在,即「如何闡述問題並提供解決方法,用這些資料、數據是否充分?」對於研究工作來說解決了這個問題關於數據方面的其它問題都是細節。不知道我這推測是否符合題主的心意?如果答案是肯定的話,我的想法見下文;如果不是,歡迎題主指正:)

要解決「如何闡述問題並提供解決方法,用這些資料、數據是否充分?」這個問題,我的想法是:

  1. 先把問題想明白,邏輯理順,再想用什麼形式、資料數據表達出來。
  2. 要做到1,需要大量閱讀同行研究,政府文件,行業新聞,及日常思考與同行交流。
  3. 在執行2的時候,養成良好的數據整理習慣:基礎數據固定時間更新,甚至銘記在心;隨案例產生的數據以政府性網站--&>行業資料--&>大學等研究機構的順序排採信度。

至於問題描述中的具體問題,解決途徑的關鍵大概是用Google來搜索吧......關鍵詞+數字來溯源,關鍵詞+數字來找最可信的來源...
祝題主工作開心。

另外,何先生的回答非常酷炫,讓我這Excel三腳貓水平的小朋友艷羨不已,希望他的工具能早日推出,造福大家。


高票給的太全了…- -
補充兩個:BIS網站、UNcomtrade、CEIC…
當然最好用的還是google..
也是稍微意識到爬蟲對檢索非數字信息的重要 想要學一下..


2014年俄羅斯的GDP
世界各國GDP排名 百度百科說是2.10902萬億美元。
2014年世界各國GDP排名(IMF2015年4月14日公布) 360圖書館說是1.857萬億美元。
巧的是,他們都說是IMF公布的。
2014世界gdp排名 最新世界gdp排名 南方財富網說是2.06萬億 發布時間是 2015.3.1 沒說數據是哪來的。
俄羅斯央行說俄2014年經濟增長率為0.6% 新華網說俄羅斯2014GDP約合1.03萬億 發布時間是2015.1.30 還說這是俄羅斯央行說的
而新華網在這篇2015.1.22的報道2014年俄羅斯財政赤字佔國內生產總值0.5%里又說,俄羅斯2014年GDP14.496萬億盧布(約合2230.6億美元) 說這個數字是俄羅斯財政部說的 呵呵
2014年俄羅斯GDP18386億美元 (轉載)_台灣 天涯說這個數字1.838631萬億。發布時間是2015.2.7 沒說資料來源

那麼請問你,2014年俄羅斯的GDP到底是多少?


數據尋找的確需要更好的技巧、策略,但是,我們這行每天加班加點,全國到處飛,沒有時間升級數據技巧。

拿我來說,每天為了數據費盡心血。

  • 數據大而雜無從下手。

像最牛的萬得,所有數據全鋪在我面前,一個懵逼的表情不過分。可能是我有點笨吧,不太會用。

  • 財經網站雖多,數據入口根本找不到。

我經常去東財、和訊看,挺豐富的,就是點開各種頁面,找不到數據入口。

  • 各種數據軟體我都試過,數據就那麼回事吧。

公司給的軟體,付費的不付費的都試了,咋說呢,花錢的軟體數據是多,就是用起來沒那麼方便,費神,找半天也找不到我想要的…...

你們會這樣嗎?有沒有好的方法?

我整理了一個效率較高的找數據的方法,大家可以試下哈

鏈接:

http://note.youdao.com/noteshare?id=d9d3cb7b1041cc9bf2401b33da088bffamp;amp;sub=DFB1D17DEFE84303BAFF2AD7CCA142B2


貼幾個數據網站給你吧

http://www.199it.com/

http://data.stats.gov.cn/

https://xueqiu.com/dh


最近在 github trending 上看到的:awesome-public-datasets。啥都有,awesome!
金融部分:awesome-public-datasets#finance


有一個實用小技巧,搜索google scholar上的論文,如果不是特別細分的數據的話,基本上都能找到許多論文裡面整理好的帶有source的數據


推薦閱讀:

你為什麼離開諮詢行業?
會計事務所的諮詢部門是做什麼的?

TAG:投資銀行 | 數據 | 諮詢行業 | 爬蟲 (計算機網路) | 金融 |