可不可以基於海量數據預測股票?

以全世界若干年所有股票的數據為樣本,並記錄股票漲跌的同時世界上發生的大事件,並實時記錄現在的數據。

也就是只考慮股票數據和相關新聞本身,不考慮有多少人在什麼時候買賣了哪些股票。

可不可以用這種方法預測第二天某一支股票的漲跌,甚至漲跌的幅度?


各大券商的研究所,金工研究員們不都在干這個嗎?有不少好的點子,如果可以深入研究的話。


基於統計的預測,無非是根據收集過去時間的數據,建立一個模型,來計算未來時間的數據。

建立的是一種數學或者統計模型,它能表現出已有數據的一些規律,但是未來的數據是否遵循這種規律,是不一定的。尤其是外在環境變數太多,甚至有人為因素。

所以我個人不覺得這種預測模型可靠。


要看你認可哪種程度的預測,比如說55%概率的預測對你有意義么?如果有的話,你一定是有一套和概率預測相匹配的投資方案,同時也有基於這種方案的盈利計劃。


可以,而且,正在……

視頻封面凱文·斯拉文:演算法如何塑造我們的世界視頻


1. 技術派走的不都是預測嗎? 特別是上了程序化交易的。所謂趨勢,波浪,各種反轉形態,其實都不是根據歷史股價來預測的? 這都還沒用上其他大數據。心理學不是號稱技術派的基石嗎?如果拿到大眾的描述對市場公司的心理數據(社交網路),基本就測得大概准了。

但是預測對了就能掙錢嗎? 這個就不一定。 風險的控制,資金管理,自我情緒的管理這些都也很重要。技術大牛們都說系統交易到最後都是對人性的考驗。

2. 理論上,價值投資派也可以預測。 因為你有足夠的數據,能統計出來每個人的衣食住行數據, 都差不多能預估相應公司的財報了。

但是財報好股票就漲了嗎? 也不一定, 公司的估值從來都是模糊的,和整個市場經濟,大盤都有關聯,市場不總是有效的嘛。

所以問題是理論上可行, 做起來可不簡單

1. 怎麼去收集到那些含金量比較高的數據?然後還得把這些數據都打通了

2. 怎麼建模型?成千上萬個特徵,上個簡單的回歸,也搞死人了吧

2. 你預測出要跌了。你還得知道風險多大,投入多少頭寸合適,止損點止盈點,退出點在哪裡 。解決了這些其他問題,才能掙錢?而這些問題都不比股價預測簡單。


理論上可以,實際上很難。

與股價直接相關的是各種信息,利好和利空信息。

利好信息如:用戶數高速增長,營收高速增長,新業務高速增長,利潤高速增長,新來了全球第一的CEO,行業處於大爆發,政府大力支持……

利空信息如:營收下跌,利潤下跌,新業務受阻,CEO不得力,高管流失,財務造假,行業下行,政策不利……

如果你要預測股票走勢,那麼:

1、你需要提前獲得這些變數數據;

2、你需要搞清楚變數之間的關係,因為很可能同時有利好和利空信息;

3、更重要也是你沒辦法控制的是其它人的行為:就你一個預測上漲,還有10萬人預測下跌,50萬人隨機跟風,怎麼辦?你怎麼保證幾十萬散戶按照你的想法操作?


大數據預測股票,是完完全全可行的,而且非常非常賺錢。美國次級貸金融危機期間,採用大數據自動交易的股票基金,仍然翻倍。

其實道理很簡單,全世界漲跌幅度大的股市,都是大資金圍剿散戶的狩獵場,裡邊的規律是顯而易見的。


當然可以啦。

有興趣可以去我們網站查詢大盤和個股趨勢,這是我們根據最細的level2逐筆數據計算每一筆成交的數據分析,我們以此避過多次大跌,比如春節前的大跌,看下圖第一個圖表,可以知道其實股指一直上漲的時候大單資金凈流入為負,大單資金連續大量出逃,那麼就是故意拉高出貨,也就大跌在即了:

今天我們剛剛拋出一半倉位的300042,就是這麼算出來的。統計分析真的可以幫到我們賺到錢。我再舉個具體例子,日內成交量是可以用數學方法預測的,比如早上10點,你就可以大概知道了今天一天的成交量,成交量又是和漲跌密切相關的,那麼你就知道今天手上這隻股是拋還是繼續買入了。我們有個網站,可以看到我們用的level2數據。


我覺得可行,股票市場應該是市場多空雙方的博弈,數據統計所做的應該就是根據歷史經驗和短期指標,分析未來的走勢,短期指標即反應了當時人們的成交和對短期的預期,數據分析的結果應該只是適應於短期的走勢,長期的走勢受制因素太多,而且人們的交易行為在變。


不現實。

有用的消息和內幕消息一般掌握在少數人手裡,這些人通常是股市的贏家。

市場上公開的消息是大多數人都知道的,如果基於統計來做預測,你能統計到的也絕大多數是公開消息,內幕消息你還是統計不到,因為它被掌握在少數人手裡。

所以基於統計來做股票,輸的可能性還是大。

一些投資機構,大投行會花高薪養一些研究員直接去公司調研,跟公司高層聊天喝咖啡獲取的信息比統計來的可靠得多。

在信息不對稱的行業里,要想贏,那就成為擁有信息優勢的一方吧!一般人很難做得到,所以股市裡大部分人都會虧損


我知道一個大學教授從投行拿了一大筆錢,就在用大數據作炒股的模型,效果怎樣,就不知道了。但是股票真的很複雜,就像上面說得,永遠預測不了人的心理。


可以,你搜索一下 two sigma, 以及與之類似的公司。


數據必須有效,才有研究和預測的價值。

我們的股市,很多市場數據遭扭曲、很多財務數據屬偽造,基於此類劣質數據預測出的結論怎麼可能可靠?

再舉個簡單例子:為什麼在百度往往連搜索一個醫院的聯繫電話都辦不到?難道是百度網路爬蟲爬的網頁不夠多嗎?


你理現在的操作手法已經不遠了,再多研究研究就可以上手了


數據挖掘從業者們就在干這事兒。大數據就是這麼用的,不過難點在於如何提取有用數據建立有效模型。因為大數據背景不同於傳統數據,是先有數據後有模型的,這樣導致模型的可靠性,時效性不夠健壯,但總體上肯定是可行的,畢竟大數據的核心思想差不多就是以史為鏡


做這個事情的人很多。但是我想說的是「通過大數據預測股票價格」這件事裡面,有一個小小的矛盾。

「通過大數據預測" 這是一個統計學的問題。

「預測股票價格」 這是一個經濟學的問題。

一個統計學的問題,關注的重點在於發掘變數間隱藏的相關性。

一個經濟學的問題,關注的重點在於解釋現象之間的因果性。

那麼相關性等於因果性么?

所以,「即便(礦工們的)高頻交易模型帶給他們再高的alpha,他們心裡也清楚,眼前的成功,都只是因為他們的幸運罷了。」 -- 《Quant》


這些都是不靠譜的拉!中國的股市,是通過大數據就可以提供有價值的參考內容麻


推薦閱讀:

為什麼在貼吧有騙子冒充劉鵬程?
已知中美合作訂單整理
重新洗牌,市場亂局還將持續幾日
明日如何操作—破關途中,節前可大膽低吸

TAG:數據挖掘 | 數據分析 | 股票 |