機器學習——到底在量化投資中用的好嗎?


這個問題我們在全網發出後,有很多讀者留言了,現在全部貼出來!希望我們可以繼續討論!

前言在前天,我們發布了一篇推文,想請大家來說說這個話題,總共收到了48條留言。對此我們按照點贊從高到底進行一個整理匯總。大家也可以繼續評論,或者說說哪個作者說的有道理哈!

@濮元愷

老師告訴我:為了區分一隻貓和一隻兔子,我只需要一條魚做Classification,外加一條胡蘿蔔做Cross Validation就可以了……

愚蠢的美國佬需要用裝備了8個GPU的伺服器訓練152層的神經元網路幾十小時才能做到,而且不能保證百分之一百準確無誤……

@鄭小龍

只不過沒有幾個真正理解機器學習又懂金融的人而已。

@李錦濤

這個問題,要澄清幾個概念,「機器學習」「量化」「投資」。 什麼是機器學習,這個也有很多層次的,如同電腦的286/386/486/PII/i3/i5/i7/GPU......

什麼是量化,這個也有很多層次的,諸如:趨勢量化、多因子量化、阿爾發、大數據、神經網路、遺傳演算法.....

什麼是投資,這個也是很多層次的,諸如:價值投資、高成長投資、一級市場、二級市場、期權、期貨、指數......

籠統的說,「機器學習在量化投資中用的好嗎?」,如同說,「馬路上有個人,這個人是不是好人?」 沒有意義的。呵呵。

@曲百萬

確實有用,現在路演時你要不把部分章節留給機器學習,資方都不一定正眼看你。各種決策樹、隨機森林,貝葉斯模型,svm支持向量機,深度學習,神經元balabala最後都把倉建到了低位放量的股票上。

@俊盛

從我導師的角度,沒有基於投資學理論基礎的,沒有任何意義。從目前自己的嘗試中,我也贊同,特徵選擇,特徵構建,才是最重要的。

@路過

以我十年量化苦旅,沒有任何用。真的

@榕樹

這還用問嗎,有用的也會說沒用

@余曉秋

如果某金融時序,在足夠長的時段內,存在近似穩定的內在規律,那機器學習可能把它提取出來。如果不存在穩定規律,隨機成分佔主導,任何方法(包括機器學習)實際上都無效。

@寧寧

很多機器學習模型說白了就是概率統計,量化中很大一部分是基於概率統計的,所以當然有用,只是大部分人不知道怎麼用罷了,因為其中涉及到特徵的提取,噪音的過濾,避免過擬合。。。其中的坑當然不少

@楊恩源

機器學習還需在數學理論上有針對金融時間序列數據的巨大突破,才有可能在量化投資有較好的運用!這就不是我們這些不造輪子用輪子的人所能解決的事了。

@楊連詩

投資本就是大道至簡,量化更是如此,明明簡單的搞複雜了能賺得更漂亮?

@張博瑜

有用,機器學習本質是對量化投資的更深層次的量化。只不過目前有效的方法很少,隨著機器學習的發展,會產生越來越合適的演算法。這個本就是一個不能證偽的話題,卻總有人拿著自己有限的了解,證明機器學習在量化上行不通。

@石川

人類花巨量時間腦力和精力能夠master的技能,機器學習註定會秒殺人類,比如圍棋,比如人臉識別(最強大腦)。但是對人類都沒法搞明白的東西,機器學習在未來二十年內也無能為力,比如二級市場投資。

@Leo

我很好奇有沒有哪家公司是做以機器學習主導的量化,如果有的話,還讓人感覺有希望。

@未知

我自己做的模擬,收益不穩定,少的時候一年就3%,多的時候一年十幾。

@楊磊

成功案例不會公布啦,哈哈。

@Bill

我做到了,你沒做到而已

@富強

以個人經歷來看,機器學習重要的是數據源,然後是演算法,拋開數據談演算法有點空中樓閣的意思

@大春

機器學習作為一種量化手段,肯定是可以用的,自適應的機器學習,深度學習,對量化一定是有作用的,投資市場也是人的博弈的過程,人的思維總會留下軌跡,這個就是需要機器學習,深度學習,遷移學習這樣的方法的學習記憶的過程。不是沒用,而是沒用對,或者用的好的沒有公布怎麼用而已,畢竟策略公布後一段時間後就會失效

@顏晉南

用來分析股票之間的關聯,這是我的想法。

@關偉

不知道,感覺有點虛。

@sunrise

高頻交易不好說,似乎有施展拳腳的空間,長期的投資來看,同意上面一位同學的觀點,就是大道至簡,不管是機器學習機器遺忘還是人工智慧人工智障,只有theory based策略才能真正奏效,如果複雜模型和簡單模型是同樣的實質,為啥還要暴力運算呢不過反正策略經過一段時間都會失效的,機器學習相對小眾,失效會稍慢?!

@何飛穎

我司在用,前兩年非常牛逼,今年開始走平,個人認為要用來挖絕對的聖杯是不可能,市場內在規律也在變化。

@Channel,CMT

有用,提高了效率和準確率,但是風險還是存在的。

@Seeking Alpha

機器學習就跟價值投資一樣,被人說爛了。

@朱鑫垚Solo

機器學習只是工具,主要解決預測和分類的問題,目前來講需要數據量比較大。如果應用在正確的方向和問題上,對於一些高頻的數據一定會有不同於以往的進步。但其他方面還有待探索吧。

@笨JOJO

可以用,但是要做點處理。

@AG Stalker

實踐告訴我,用機器學習演算法優化cta策略的部分模塊效果非常好。

@Ian Feng

值得一試,預計效果比SVM, 隨機森林,HMM稍微好點。

@鴻

看如何用,一條均線也可做出好策略。

@Flynn Gu

經濟學原理還不是人發現的,你能保證這個一定對嗎,一些規律會隨著市場進化而消失,也有可能內在的規律我們並沒有發掘到,所以能接受市場檢驗的機器學習就是make sense的。

@天下熙熙

這個教授可能是聰明的笨蛋,拿魚誘惑照片中的貓,服!

@wang

量化投資與機器學習違命題或不完全真命題?

@吳

投資金融一類的隨機性很大,當前的機器學習很大程度都是模型,機器學習的方法會有成功案例,但還有待挖掘。

@量化的X

如果價格走勢存在規律,那就有用。alpha因子中由價格和成交量得到的因子有效的話,那麼價格和成交量作為ml輸入得到的結果也理應有效。

@harford

還沒到那麼高的選擇和優化能力。

@Mr咩星人

寫作業時感覺HMM還可以,不過實戰中感覺一般。

@楊磊

LSTM絕對有用啊。

@Simon

機器學習範圍太大了,不如先討論下神經網路。

@行者(Batuwaa)

沒看到幾個成功案例阿!

@背匕的我

編輯部覺得價值回歸模型,因子模型,差分模型,隨機過程模型哪個更靠譜。

@楠公爵

機器學期應該是基於大數據的,應用在高頻交易應該效果比較好一點。

@天馬行空

可以用來過擬合,還讓人看不出來。

@Navi

機器學習就是一把利劍,用不用的好全憑個人。


金融數據信噪比很小,導致train set很容易overfit。可能做了半天,結果就是feature都擬合了train set里的噪音。

我本人是做套利的,統計的要求不需要很高,試來試去,還是用linear regression最有效,可以自行加一些判斷來解決一些肥尾情況,基本上就夠了,你有arbitrage,我都能套。機器學習的暗箱操作,很多時候給系統帶來的是operational risk(難以debug),其他沒什麼好處。

當然,做alpha對沖策略的才是機器學習高手雲集的地方。比如citadel五月份挖走了微軟的首席機器學習官鄧力,他這種高手我相信能把統計/ml模型做得非常漂亮。


推薦閱讀:

2017 年你眼中最好的券商量化策略研報是哪篇?有哪些亮點?
大家聊聊使用JoinQuant是什麼體驗?
如何在交易上處理 low volatility 的趨勢性行情?
什麼是波動率傾斜(volatility skew)?有什麼作用。
「獨立寬客」是否可行?

TAG:量化 | 機器學習 | 深度學習DeepLearning | 量化交易 |