可不可以基於海量數據預測股票?
以全世界若干年所有股票的數據為樣本,並記錄股票漲跌的同時世界上發生的大事件,並實時記錄現在的數據。
也就是只考慮股票數據和相關新聞本身,不考慮有多少人在什麼時候買賣了哪些股票。可不可以用這種方法預測第二天某一支股票的漲跌,甚至漲跌的幅度?
各大券商的研究所,金工研究員們不都在干這個嗎?有不少好的點子,如果可以深入研究的話。
基於統計的預測,無非是根據收集過去時間的數據,建立一個模型,來計算未來時間的數據。
建立的是一種數學或者統計模型,它能表現出已有數據的一些規律,但是未來的數據是否遵循這種規律,是不一定的。尤其是外在環境變數太多,甚至有人為因素。
所以我個人不覺得這種預測模型可靠。要看你認可哪種程度的預測,比如說55%概率的預測對你有意義么?如果有的話,你一定是有一套和概率預測相匹配的投資方案,同時也有基於這種方案的盈利計劃。
可以,而且,正在……
凱文·斯拉文:演算法如何塑造我們的世界視頻1. 技術派走的不都是預測嗎? 特別是上了程序化交易的。所謂趨勢,波浪,各種反轉形態,其實都不是根據歷史股價來預測的? 這都還沒用上其他大數據。心理學不是號稱技術派的基石嗎?如果拿到大眾的描述對市場公司的心理數據(社交網路),基本就測得大概准了。
但是預測對了就能掙錢嗎? 這個就不一定。 風險的控制,資金管理,自我情緒的管理這些都也很重要。技術大牛們都說系統交易到最後都是對人性的考驗。
2. 理論上,價值投資派也可以預測。 因為你有足夠的數據,能統計出來每個人的衣食住行數據, 都差不多能預估相應公司的財報了。
但是財報好股票就漲了嗎? 也不一定, 公司的估值從來都是模糊的,和整個市場經濟,大盤都有關聯,市場不總是有效的嘛。所以問題是理論上可行, 做起來可不簡單1. 怎麼去收集到那些含金量比較高的數據?然後還得把這些數據都打通了
2. 怎麼建模型?成千上萬個特徵,上個簡單的回歸,也搞死人了吧2. 你預測出要跌了。你還得知道風險多大,投入多少頭寸合適,止損點止盈點,退出點在哪裡 。解決了這些其他問題,才能掙錢?而這些問題都不比股價預測簡單。理論上可以,實際上很難。
與股價直接相關的是各種信息,利好和利空信息。
利好信息如:用戶數高速增長,營收高速增長,新業務高速增長,利潤高速增長,新來了全球第一的CEO,行業處於大爆發,政府大力支持……
利空信息如:營收下跌,利潤下跌,新業務受阻,CEO不得力,高管流失,財務造假,行業下行,政策不利……
如果你要預測股票走勢,那麼:
1、你需要提前獲得這些變數數據;
2、你需要搞清楚變數之間的關係,因為很可能同時有利好和利空信息;
3、更重要也是你沒辦法控制的是其它人的行為:就你一個預測上漲,還有10萬人預測下跌,50萬人隨機跟風,怎麼辦?你怎麼保證幾十萬散戶按照你的想法操作?
大數據預測股票,是完完全全可行的,而且非常非常賺錢。美國次級貸金融危機期間,採用大數據自動交易的股票基金,仍然翻倍。 其實道理很簡單,全世界漲跌幅度大的股市,都是大資金圍剿散戶的狩獵場,裡邊的規律是顯而易見的。
當然可以啦。
有興趣可以去我們網站查詢大盤和個股趨勢,這是我們根據最細的level2逐筆數據計算每一筆成交的數據分析,我們以此避過多次大跌,比如春節前的大跌,看下圖第一個圖表,可以知道其實股指一直上漲的時候大單資金凈流入為負,大單資金連續大量出逃,那麼就是故意拉高出貨,也就大跌在即了:
今天我們剛剛拋出一半倉位的300042,就是這麼算出來的。統計分析真的可以幫到我們賺到錢。我再舉個具體例子,日內成交量是可以用數學方法預測的,比如早上10點,你就可以大概知道了今天一天的成交量,成交量又是和漲跌密切相關的,那麼你就知道今天手上這隻股是拋還是繼續買入了。我們有個網站,可以看到我們用的level2數據。我覺得可行,股票市場應該是市場多空雙方的博弈,數據統計所做的應該就是根據歷史經驗和短期指標,分析未來的走勢,短期指標即反應了當時人們的成交和對短期的預期,數據分析的結果應該只是適應於短期的走勢,長期的走勢受制因素太多,而且人們的交易行為在變。
不現實。
有用的消息和內幕消息一般掌握在少數人手裡,這些人通常是股市的贏家。
市場上公開的消息是大多數人都知道的,如果基於統計來做預測,你能統計到的也絕大多數是公開消息,內幕消息你還是統計不到,因為它被掌握在少數人手裡。
所以基於統計來做股票,輸的可能性還是大。
一些投資機構,大投行會花高薪養一些研究員直接去公司調研,跟公司高層聊天喝咖啡獲取的信息比統計來的可靠得多。
在信息不對稱的行業里,要想贏,那就成為擁有信息優勢的一方吧!一般人很難做得到,所以股市裡大部分人都會虧損我知道一個大學教授從投行拿了一大筆錢,就在用大數據作炒股的模型,效果怎樣,就不知道了。但是股票真的很複雜,就像上面說得,永遠預測不了人的心理。
可以,你搜索一下 two sigma, 以及與之類似的公司。
數據必須有效,才有研究和預測的價值。
我們的股市,很多市場數據遭扭曲、很多財務數據屬偽造,基於此類劣質數據預測出的結論怎麼可能可靠?
再舉個簡單例子:為什麼在百度往往連搜索一個醫院的聯繫電話都辦不到?難道是百度網路爬蟲爬的網頁不夠多嗎?
你理現在的操作手法已經不遠了,再多研究研究就可以上手了
數據挖掘從業者們就在干這事兒。大數據就是這麼用的,不過難點在於如何提取有用數據建立有效模型。因為大數據背景不同於傳統數據,是先有數據後有模型的,這樣導致模型的可靠性,時效性不夠健壯,但總體上肯定是可行的,畢竟大數據的核心思想差不多就是以史為鏡
做這個事情的人很多。但是我想說的是「通過大數據預測股票價格」這件事裡面,有一個小小的矛盾。「通過大數據預測" 這是一個統計學的問題。「預測股票價格」 這是一個經濟學的問題。一個統計學的問題,關注的重點在於發掘變數間隱藏的相關性。一個經濟學的問題,關注的重點在於解釋現象之間的因果性。那麼相關性等於因果性么?所以,「即便(礦工們的)高頻交易模型帶給他們再高的alpha,他們心裡也清楚,眼前的成功,都只是因為他們的幸運罷了。」 -- 《Quant》
這些都是不靠譜的拉!中國的股市,是通過大數據就可以提供有價值的參考內容麻
推薦閱讀:
※為什麼在貼吧有騙子冒充劉鵬程?
※已知中美合作訂單整理
※重新洗牌,市場亂局還將持續幾日
※明日如何操作—破關途中,節前可大膽低吸