如何用機器學習跟著許家印在恆大股票上三周賺一倍
5月11日,比特港撰寫了恆大地產借殼引來做空狼群,漢能千億挾空戰重演?這篇基於量化分析的文章,當時恆大(3333.HK)剛剛結束了調整,還在8元平台橫行。之後恆大連續暴漲,從5月9日到29日實現了三周翻倍。很多業內和機構的朋友都對我們的模型和數據來源很好奇,但授人以魚不若授人以漁,這裡簡單談談比特港分析恆大挾空所用的機器學習模型。
金融圈的問題在於,如露如電的規律來不及被認識就改變了
像恆大地產這種千億級別的挾空,在港股乃至全世界範圍都不是很常見的例子。記憶之中,大概也就只有2014年到2015年的漢能薄膜能夠比肩。但比特港為什麼能夠在如此罕見的事件發生前,就偵測到異常並且發出警告呢?這次預測成功來自於非傳統的基於查詢的定製學習模型,專精高維空間的稀疏樣例學習。
其實大多數機器學習模型,特別是近期最火的神經網路變種深度學習並不適合金融圈。因為金融圈的規律在機器學習界可以稱之為Emerging patterns(新興模式),也就是一個規律重複自身的頻率極短,而歷史上想找到和對應場景接近的例子非常之難,比如負利率或者滯脹,找來找去也只有幾個例子。又比如分析員想做60年的長周期分析,那麼就只能有2-3個周期。在這種情況下,用傳統的學習模型得出的例子常常是極不靠譜的,因為取樣太少,帶來的偏差波動範圍可以很大。
而當一個規律重複自身的次數足夠多,傳統學習模型得以充分認識的時候。市場的互動就會很快消滅掉這個規律,變成「諸法因緣生,緣謝法還滅」。在這種情況,能夠在一個規律剛剛出現1-2次的稀疏數據時期,就能夠學習和預測這種模式成為金融市場機器學習的關鍵。
而投資者要想捕捉一個可能幾年才出現一次甚至十多年才出現一次的機會的時候,投資者可能已經有一個或幾個大概的方向,而這個帶有方向性的問題將輔助基於查詢的學習模型,補充歷史樣例的不足,實現更高的預測精度和準確率。
恆大地產挾空發生前,至少從四個另類數據維度發出信號
輿情維度引發比特港關注恆大地產的最早來自輿情維度的異動,包括金融時報和華爾街日報在內的幾家重磅國際金融報紙幾乎在同一天突然集中抨擊恆大地產,考慮到這些媒體的權重和他們使用的「操縱」這些罕見的關鍵字,在香農信息墒的框架下,信息量非常豐富。
而交易所公告方面,同期也有一些非常異樣的信號,比如回購幾百億的債券。
行為學維度每個媒體都有自己的價錢,沒有哪個財經媒體會閑得無聊寫空頭評論得罪財神爺。華爾街日報的文章會讓有經驗的投資者很快產生一個問題,是否有人做空被挾得很痛?僅僅從做空比率上看不出太多異樣,於是比特港立刻回溯了從監管部門獲取的大額(鱷)做空恆大地產申報的總頭寸,總數高達僅6億股,而這還沒有包括不需要申報或者繞開申報的空頭頭寸,而這個數據結合下面的籌碼分布和內部人行為看更有意思。
籌碼分布維度
籌碼在券商席位的分布就類似一副21點牌局的分布。當非常低概率的牌面出現的時候,職業投資者屁股下面的凳子就會開始發燙了(Hot Seat),而比特港的異動指標就會發出警告。在恆大地產三月和五月的兩輪上漲之前,比特港基於籌碼分布統計(十億條數據級別哦)的異動指標就多次發出及時警告。
而用比特港網頁工具仔細的鑽取(Drill Down)之後可以發現(列表太長不發了),在第二輪瘋狂挾空之前,籌碼除了通過滬深港通買入(上市公司回購)之外,基本上少數幾個券商和一些中資常用的券商吸納了絕大多數的籌碼,而包括散戶大本營的滙豐和融資融券大戶JPM/UBS/盈透證券籌碼都在不斷減少(空頭累計持倉續增)。
簡單來說,雙方繼續招兵買馬,局面善了的可能性已經越來越小。再用下面的維度來衡量,不死不休的局面的已經難以避免。
內部人行為維度恆大在股價上升的第一輪裡面,用短短一個月時間就回購併且立刻決絕地註銷了7億股,高達5.25%的總股份比例。而贖回560億債券的動作更加說明恆大短期內有資金實力,發動一場千億市值級別的挾空戰爭。對於願意再從輿情維度深挖許家印的性格和商業行為模式的人來說,這場戰爭的可能性幾乎已經是九成九,所以比特港立刻發出了預測的文章。
升維學習對傳統AI模型是詛咒,對交易者是祝福!
簡單的概率學就可以告訴我們,如果能找到三四個互相獨立的數據來源產生的指標,即便每個都只有55%這種很多人不屑一顧的正確率。那麼它們同時發出同樣的預測結果時,其準確度可以高達90%-95%!比特港提前幾天預測恆大地產的挾空,就是一個典型的例子。
但傳統行情分析,無論你用幾百幾千中不同的模型和指標,都是來自於市場行情數據。這固然和教科書上說的行情數據包含一切的假說吻合,但卻只能製造同源而無法互相獨立的不同指標和系統。這就要求投資者首先擴展自己的視野,將資訊獲取的維度儘可能增加,然後根據自己的問題來進行度身定做的查詢/學習。
掌握了這個升維學習的方法,加上比特港平台的輿情/籌碼異動/龍虎榜/期權異動/這些獨特而另類的數據維度。交易者有任何的猜想或者交易Idea,都可以用上面的模型進行驗證和決策支持!
很抱歉通知從五月開始比特港的異動指標將只能在每天中午12:00之後免費查詢。(付費用戶得以提前幾小時在早盤入場)另外異動指標本身並非多空信號,根據過去幾個季度700個異動個股的全面追蹤,異動指標發出後兩個月內個股平均波動率可以高達68%,而其中包括很多大幅下跌的品種,不問三七二十一一律在一周內買入的策略大約年化回報率也只有13%左右。
所以異動指標投資者必須結合其他數據維度和投資者經驗判斷來使用,這個指標的主要意義在於將每天監察幾千隻股票的雷達範圍縮窄到幾十個範圍以內,或是監控投資者重倉股何時面臨臨界點。大幅度提高投資者的數據洞察和有效資訊獲取,自然事半功倍。最後羅列一下過去半年比特港基於機器學習的異動指標的成功預測:
恆大地產夾空兩周上漲50%,5/11預警
膳源控股IPO後半年持續預警,上漲超過600%
百麗私有化提前兩月預警
年初預警碧桂園,之後上漲100%
國美回購上漲15%
聯通混改大幅上漲25%,提前2個月預警
首都機場預警後,2個月上漲58%
海爾電器預警後上漲37%
神華派發特別股息上漲25.8%,提前10天預警
阿里巴巴私有化銀泰商業之2個月發出預警
更多精彩獨家新聞文章,港股和境外投資大數據工具,請下載:比特港股新聞
推薦閱讀:
※許家印教授與恆大集團的萬億負債
※恆大真如你們所說那麼不堪嗎?
※恆大的精裝修房質量到底如何?
※住了2年恆大的精裝房,打算全款買下來,120萬貴嗎?
※恆大地產近期連續併購新世界和周大福 9 個地產項目背後有怎樣的商業邏輯?