如果掌握了大數據,能不能預測股市?
要弄清大數據(Big Data)與股市預測(Stock Market Forecasting)間的關係, 我們需要先區分幾個基本概念: Wisdom,Knowledge,Information,Data
這個東西叫 DIKW pyramid
DIKW pyramid - Wikipedia
下面這幾張圖說明了Data到Wisdom的轉化過程:
我們可以看出,raw data無論大小都不能直接用於decision-making, data必須經過加工變成wisdom才行, 這是個不斷增值的過程:
而這個過程是艱難的,因為我們所見所聞,絕大多數都是Noise, 連Data都不算:
我們不能簡單地把Data和Wisdom,Knowledge,Information這些概念等同起來!
否則很容易跑偏:
甚至......
現在,回到我們的問題, 掌握了大數據,到底能不能預測股市呢?
因為預測股市需要wisdom, 而big data還只是停留在data這個層面上。所以,掌握big data並不意味著更準確的stock market forecasting, 只有當你同時還掌握將big data轉換為wisdom的手段,big data才能真正發揮威力。
當前,很多互聯網/互聯網金融公司都宣稱使用了big data, 可又有幾家真正具備從big data中獲取wisdom的能力呢?
謝邀。當然可以。這方面的論文已經堆積如山,隨手來兩篇:
- 《A Review: Analysis of stock market by using big data analytic technology》
- 《The Implications of Big Data in Indian Stock Market
》
大數據和股票方面恰巧有一定的了解,試著做一個回答
從此前市場數據來看,用大數據做股票預測是有一定有效性的,而且也能夠帶來一定的超額回報。
不過,從金融市場有一些自己的特性,所以大數據對股票形成有效預測也有一些需要解決的問題
1.金融數據的高噪音:真實的信息被淹沒在噪音之中,如果不對噪音進行處理,很難得到有效信息
2.金融市場的弱平穩性:金融市場本身是弱平穩的。對於市場數據的分析預測如果一直採用同樣的模型,很難長期有效。
所以,如果要有大數據的方式嘗試對股票市場做出有一定準確度的預測,就需要有一個從大數據中分離有效信息,並能夠根據金融市場當下狀況進行實施調整的模型。
而對於整個數據的分析預測來講,大致也需要以下的幾個步驟:
首先需要對金融數據進行降噪,儘可能減少噪音的影響。簡單的話這裡可能會採用一些濾波的方法,比如均線、kalman濾波等等
濾波之後的數據本身可能還不能與需要預測得數據形成較好的對應關係。而且大數據的情況下,可能本身的數據就是幾百上千維,直接處理對於計算機來講也是不現實的。所以這裡還需要進行降維。簡單做一下的話可以採用很多線性的方法,比如pca等等。或者一些非線性的比如神經網路深度學習之類的也可以用到這裡
之後可以嘗試做一下建模,這個就要看具體打算預測什麼數據。
最後考慮到金融市場本身的弱平穩性,就需要根據最新數據的反饋對模型進行實時調整。這裡可以採用一些統計學的方法,當然機器學習方面的一些演算法也可以都加進來
不過要真正實現用大數據對股票市場進行有效的預測並不簡單,在無套利的假設下,如果想獲得額外的利潤,肯定是需要在某些方面有過人之處。而具體到向通過大數據做股市的預測方面,具體就是下邊的幾個能力:
對於絕大多數參與者而言,所擁有的數據僅僅是市場公開數據,很難在數據這一環佔據優勢。但是如果是一些擁有大數據資源的參與者,就可以在這一層超過市場上的平均水準。
擁有數據只是有了最基本的材料,但是最終結果能否做好還需要看之後數據處理的活做得怎麼樣。這方面需要好的演算法,從原始數據中提取有價值的信息。這裡可以參考一家著名的公司:文藝復興科技,他們的早期團隊在最大熵方面方面有很強的學術背景,可以猜測他們的處理方式與之有關。除了這個例子之外,在大數據做金融數據預測方面,也就是通過什麼樣的演算法能夠更快更好提取有價值信息乃至做出決策。
最後的一環就是算力。如果交易對手也有數據,也有好的演算法,對於市場上的某個交易機會,剩下的就是誰先算出來以及誰先成交的問題。對於用大數據方面預測金融數據,如果大家都是同等數據、同等演算法,那麼就是看誰能更早拿到結果。交易機會稍縱即逝,最先完成的交易一般而言會容易拿到更好的價格,而如果交易機會結束前都沒有算出來,那這次的計算結果也就沒有太多價值了。
以上簡單解答了一下,但是事實上想獲得有效的預測結果並不容易。而且除了我所說的這一點內容以外,很多人對於金融市場也有更深的見解,寫這些就權當做拋磚引玉吧
霍金說過,如果你能掌握宇宙所有粒子的初始狀態和運動規律加上足夠的計算能力,就可以預測宇宙。我想股市也是可以的。但如果你根據預測進行交易就會失敗了,因為你自己進入系統內部了
只是理論上的可行,實質上的難度接近正無窮。
但是即使你把準確的預測結果用來大規模投資的時候,本身的預測也會失准。這是經濟預測的基本悖論之一。
這個原理有點類似於大名鼎鼎的「海森堡的測不準原理」:在量子物理中你不可能同時知道一個粒子的位置和它的速度,因為測量這個行為本身就會改變了測量物體的狀態。
在金融市場同樣存在「觀察者影響市場本身運動的現象」。
阿道夫.默克曾是德國著名的企業家,連續50年成功,集團年銷售額達400億美元。2008年,默克家族大舉做空大眾汽車普通股票。但保時捷對大眾的收購行動,是大眾的股票反而從200歐元升到1000歐元。默克家族一敗塗地。時年74歲的老默克無法接受失敗的現實,於2009年1月7日卧軌自殺其實,大眾汽車當時的確應該暴跌,甚至於應該接近破產。但是,當觀察者介入時,本身運行規律發生了變化。因為觀察者兼作做空者,就給本來不具備價值的大眾汽車股票帶來了價值:逼空價值。只要逼空就可以為大眾汽車帶來巨額收益。而這種逼空巨額收益原本不存在於大眾汽車股票中的,是觀察者的觀察行為帶給了它價值。
這應該是金融市場中經典的測不準原理現象了。
如果有人能搞定這事
一定能先解決偶的50行js代碼的疑問
https://www.zhihu.com/question/47996421/answer/108731587
到現在為止 一個劍橋博士 一個某操蛋985學校的學生都跪了
當然可以預測,不過有很多更簡單的方法預測為什麼還要用大數據這麼傻逼的方法??????????
神有兩個特點,全知,全能。
科技是人類的成神之路(但成神不只是科技這麼簡單)。電報到物聯網到ai的信息技術是人類走向「全知」的路。能源技術直到可控核聚變啊真空能量啊是人類走向「全能」的路。掌握大數據,人都快成半神了。雖然開天闢地、宇宙爆炸什麼的做不了(沒有發達的全能路徑的配合),預測個股票還是小意思。假設你可以預測,那麼你就可以100%勝利,結果就是你可以將市場上所有的錢賺走,然後你沒有對手盤,市場沒有流動性,你的預測也將失效。從這個假設來看,就算你能預測,最多也就能做到一段時間內有效,而永遠達不到一直有效。
當然可以了,但大數據不是量化交易,不通過根據基準模型的微小偏差發現短期大量微套利機會。不是傳統建模,建立一個模型,假設變數作回歸的,比如xx類股票上漲與xx參數正相關。也不是那種簡單的概率統計,比如前一日的股票下降3%的次日有60%概率上漲1%這種。即使要預測次日的股票,也需要全部股票過去10年數10年的走勢,交易量,和一系列企業性質數據,內外部市場環境數據,然後放在計算機里,根據設定的演算法,從裡面找出一個次日大概率會漲的股票。就算所有數據都有來源,所有軟性指標都能用數字衡量輸入計算機,以現在的普通計算機水平,有的算了,等算完,一個可能星期都過去了。。。華爾街現在還是量化交易為主的。
答:預測不了。但是,對投資有很大幫助---------------------------------------------展開來說,這句話這麼說,如果掌握了大數據,對股市預測會有很大幫助,這沒問題。但是,不能說可以成功預測股市。走勢永遠都是隨機事件,大數據所能起到的作用,是讓你預測一個大概率事件。比如,你是個高手,明天看漲,你有6成把握,那麼,通過大數據,可能能達到8成甚至更高(數字瞎扯淡的,別認真)。但是,永遠沒有百分之百,黑天鵝事件可能就在前方等著你,而且千萬不要小看這一次黑天鵝的威力。股市或者類似的投資,更看重的是你如何利用資金來對衝風險,如何面對各種情況作出應變,如何通過系統將風險降到最低。甚至說,你還得有一定運氣。市場啊,高深莫測著呢。
難度非常大。
至於為什麼大,原因在於股票市場是二級混沌系統。那麼什麼叫做二級混沌系統,這樣說吧,我們的天氣是一級混沌系統,因為天氣不會因為我今天的預測明天而變化,而股票市場不一樣了,我如果預測明天漲,那麼明天市場會因為我今天的預測而發生改變,這就是二級混沌系統,所以難度還是非常大的。首先你要完美區分大數據和內幕消息
人工智慧加大數據都不行,所謂人工智慧一定需要對一個物體或者一個事件做定義,比如貓是有鬍鬚,右耳朵,有尾巴等等,大量的數據經過學習後,才可以辨認,但股市更多的是心理博弈,比如一個政策出來,由於時間,空間不同,就會有所謂利好兌現變利空,利空兌現變利好,根本沒辦法去下一個定義,現在的量化交易說實話連人工智慧的邊都沒碰到
有一種事件叫黑天鵝~
如果能對市場上所有的(至少是主要的)交易者的交易行為模式高效地進行建模和分析的話應該可以吧,目前是不靠譜的。
覺得預測股市(指數)與預測個股要分開,個股有多人為干擾痕迹,比如今天的興業與平安,來個笨豬跳誰能預測?!相反,對於市場所處的位置,以系統風險信號(覆蓋期)後五天,(信號後)輕倉謹慎看待之,這能叫預測么?
股市未來走勢受已知因素和未知因素的雙重影響。
時間越短,受已知因素影響越大;時間越長,受未知因素影響越大;
越是有效的市場,已經因素越能反映在市場中;越是無效的市場,已知因素髮生作用的時間越長。
所有的投資策略,只能根據已經因素做出,市場越無效,主動管理才可能帶來超預期的收益。
有錢就能預測
理論上是可行的。但是這種預測有可能性的原因在於相對於其他投資者掌握了更多的信息。利潤來源於信息的不對稱性。
推薦閱讀:
※中國的大數據中心有哪些?為何新的中國的大數據中心選貴陽?
※為什麼蘋果會選擇在貴州建立大數據中心?
※沒有集群環境,怎麼學好大數據處理框架(Hadoop,Spark)的相關知識?
※大數據工程師需要學習哪些?