歐洲央行關於 Twitter 和 Google 的關鍵字流行度和股市的關係的論文中的推論是否有道理?

最後發現 Twitter 中的關鍵詞和股市的關係比較大。

&> Twitter bullishness has a statistically and economically significant predictive value in respect of share prices in the United States, the United Kingdom and Canada,

https://www.ecb.europa.eu/pub/pdf/scpsps/ecbsp9.en.pdf?177000b829d4450b007f3d3a612cab18

不知道有沒有做過這類研究的人,只通過 bullish 關鍵詞來判斷,這樣的分析過程靠譜嗎?其他方面有沒有什麼問題呢?


粗略看了下鏈接裡面的文章,文章將twitter和google search 都作為了sentiment的proxy,我覺得可能其他的解釋更加合理。twitter數據和google search的數據有以下這些根本的區別:

1. 用戶發布twitter 是一種信息供給(information supply)的行為,而google search 表現的是用戶對信息的需求(information demand).

2. 基於twitter數據可以看做情緒(sentiment) 的proxy,而基於google search數據可能更適合當做關注程度(attention)的proxy。investor sentiment和attention都有相應的理論基礎。

展開來講,在social media,textual analysis和股市預測交叉領域,我覺得還有以下幾篇文章值得推薦:

1. Twitter mood predicts the stock market

雖然這篇文章太過engineer,測試樣本選取的時間也太過特殊,我的一些看法見: 大數據技術在金融行業有哪些應用前景? - bh lin 的回答。但是最為這個領域先驅的文章,不應該繞過。

2. Wisdom of Crowds: The Value of Stock Opinions Transmitted Through Social Media

這篇發表在review of financial studies上面的文章用了seekingalpha的數據。


可以的,而且這已經不是新的方法了。我記得0幾年時就有幾個韓國人通過抓取並分析yahoo finance的評論來研究股票市場了。通過抓取twitter內容分析的文章更多。

編程上已經沒什麼難度了,Python有現成的包。

一般的文章都是把信息分為3類,bullish,bearish and neutral or correction,這也沒啥說的。在國內市場用的話,我覺得殭屍粉的發言是個問題,不過可以加行命令屏蔽掉就好了。

隨便搜了一下就有很多文章,我沒篩選金融相關的,題主自己搜搜試試,加油。


推薦閱讀:

行為金融學在智能投顧業務中如何應用?
《投資交易心理分析》一書?
「賭徒謬誤」產生的原因是什麼?

TAG:金融學 | Twitter | 谷歌Google | 大數據 | 行為金融學 |