歐洲央行關於 Twitter 和 Google 的關鍵字流行度和股市的關係的論文中的推論是否有道理?
01-09
最後發現 Twitter 中的關鍵詞和股市的關係比較大。
&> Twitter bullishness has a statistically and economically significant predictive value in respect of share prices in the United States, the United Kingdom and Canada,https://www.ecb.europa.eu/pub/pdf/scpsps/ecbsp9.en.pdf?177000b829d4450b007f3d3a612cab18不知道有沒有做過這類研究的人,只通過 bullish 關鍵詞來判斷,這樣的分析過程靠譜嗎?其他方面有沒有什麼問題呢?
粗略看了下鏈接裡面的文章,文章將twitter和google search 都作為了sentiment的proxy,我覺得可能其他的解釋更加合理。twitter數據和google search的數據有以下這些根本的區別:
1. 用戶發布twitter 是一種信息供給(information supply)的行為,而google search 表現的是用戶對信息的需求(information demand).
2. 基於twitter數據可以看做情緒(sentiment) 的proxy,而基於google search數據可能更適合當做關注程度(attention)的proxy。investor sentiment和attention都有相應的理論基礎。
展開來講,在social media,textual analysis和股市預測交叉領域,我覺得還有以下幾篇文章值得推薦:
1. Twitter mood predicts the stock market
雖然這篇文章太過engineer,測試樣本選取的時間也太過特殊,我的一些看法見: 大數據技術在金融行業有哪些應用前景? - bh lin 的回答。但是最為這個領域先驅的文章,不應該繞過。2. Wisdom of Crowds: The Value of Stock Opinions Transmitted Through Social Media這篇發表在review of financial studies上面的文章用了seekingalpha的數據。
可以的,而且這已經不是新的方法了。我記得0幾年時就有幾個韓國人通過抓取並分析yahoo finance的評論來研究股票市場了。通過抓取twitter內容分析的文章更多。
編程上已經沒什麼難度了,Python有現成的包。一般的文章都是把信息分為3類,bullish,bearish and neutral or correction,這也沒啥說的。在國內市場用的話,我覺得殭屍粉的發言是個問題,不過可以加行命令屏蔽掉就好了。隨便搜了一下就有很多文章,我沒篩選金融相關的,題主自己搜搜試試,加油。推薦閱讀: