請問有沒有哪位大神使用機器學習方法進行量化策略的回測,結果怎麼樣?


我感覺很多機器學習做量化策略都是噱頭吧。

首先需要理解機器學習到底是什麼概念,機器學習一般是給定目標的權重優化(包括經常在投資中使用的SVM和神經網路),充分利用大數據(保證儘可能重現數據概率分布特徵)。就我個人的經驗和一些人聊天所知,SVM和神經網路都是回測比較厲害,實戰不行,容易過擬合。這跟這些演算法後向更新權重有關係,不管是擬牛頓方法還是梯度下降方法在更新權重的時候都是默認數據服從正態分布或者大數定律,但實際生活中這樣的要求對金融數據來說太嚴格,厚位分布和波動聚集性都會影響金融數據的質量,導致的結果就是機器學習演算法結果不容易收斂,泛化能力較差,包括在評論中討論需要頻繁調節風險敞口和權重等問題;這個方面估計改良一下的強化學習可以試試,股票市場是一個多層級自反饋系統,而一般的機器學習都是單一目標,這裡面還涉及很多數學哲學和思維的探討有待商榷。量化的一個大前提是價格反應了所有信息(有效市場),但12月底的股價是不可能提前反應出熔斷機制的影響的,所以量化較難預測到潛在的風險,機器學習更是如此。

————————————————

更新一下,之前的表述不清楚,這個情況主要是針對A股投資的,對於期貨交易並不一定適用,因為期貨的交易特點(T+0)相對來說不像A股T+1那樣對風險預測和過擬合特別敏感,相對來說A股對於技術和理論的應用更加苛刻。還有一個方面,前文所言並沒有涉及區間內參數尋優問題,一方面是參數尋優的結果對誤差並不是很敏感,所以機器學習在此並沒有體現出其優勢,另一方面是也無法證明局部最優就是全局最優。果然有時候說話還是要考慮更周全一點,不然就是一陣被撕…並補充一些內容,前幾天看一個公司Aidyia啟動了完全智能帶有自動進化能力的人工智慧交易系統,具體的內容沒有細說,但是中間提到遺傳演算法的問題,之前自己做一些研究也從自動進化中受到啟發使用遺傳演算法,是一種無監督學習過程,而我之所以說SVM、神經網路存在過擬合問題就是覺得有監督的演算法並不是一種合理方法,因為擬合對象可能存在高估或者低估過程,人為標記又受到主觀因素的影響,所以要想機器正確理解市場,需要一些無監督的演算法用來進行反饋分析,以前也有人用強化學習演算法做,不過遺憾的事做得好的研究最後都變成了Fund而很少見諸文獻。


說到機器學習,很多人最先想到的就是支持向量機,在JoinQuant社區看到一個使用SVR的策略推薦給你。SVR預測股票開盤價

策略主旨思想是利用SVR建立的模型對股票每日開盤價進行回歸擬合,即把前一日的 ("openPrice","highestPrice","lowestPrice","closePrice","turnoverVol","turnoverValue") 作為當日 "openPrice" 的自變數,當日 "openPrice" 作為因變數。

風險

收益

感興趣的話可以去SVR預測股票開盤價拷貝源碼進行深入的研究。還有使用深度學習、聚類的,歡迎一起到社區討論

深度學習簡介、【K均值聚類】一個小案例,想知道能在股票市場做些什麼,拋磚引玉吧~


嘗試過機器學習應用在商品期貨上面,模擬效果不錯,夏普值高於普通的趨勢跟蹤策略。實盤了半年,目前還沒看到什麼過擬合的跡象。

機器學習只是一個工具,跟其他統計學的分析方法實質上類似,具體怎麼使用這個工具千變萬化。有人研究了很久貝葉斯啥都沒搞出來,有人用它做統計套利可能賺的盆滿缽滿,量化是一個挖金子的過程,努力和運氣都挺重要。


推薦閱讀:

理論、演算法、工具、實踐在機器學習/DM工程師的學習成長過程不同階段分別應占什麼比例?扮演什麼角色?
演算法研究屬於數學專業還是計算機專業?
當初的生物熱,和如今的全民CS全民AI,讓你想到了什麼?
情感分類(sentiment classification)推薦使用什麼演算法和軟體包?
如何用通俗的語言解釋CTR和推薦系統中常用的Feature Hashing技術以及其對應的優缺點?

TAG:機器學習 | 量化交易 |