中低頻交易中如何處理 aliasing?

時間序列分析(time series analysis)中一般對採集到的信息都預設是一個真實信號和一個隨機擾動的疊加。如果真實信號的頻率高過Nyquist frequency(即採樣率的一半),就會造成混疊(aliasing)。混疊後的信號是不能處理的。如果做中低頻的交易,針對aliasing有兩種情形:一是假設真實信號沒有高頻部分(怎麼求證呢),因此可以進行中低頻的採樣,二是使用高頻採樣,然後再處理,只是交易頻率較低。實際操作屬於那種?


首先要區分一下數據頻率(收集到的市場數據中的頻率)和交易頻率(交易策略下單的頻率),以下討論中提到的頻率是指數據頻率。真實信號里有沒有高頻部分不是我們假設的,而是根據數據來的。

如果你的數據是日線 OHLC,數據本身就已經做過採樣過濾掉所有高頻的成分了,可以直接上時間序列分析。

如果你的數據是那種快照形式的 L1 或者 L2,要看數據是怎麼生成的。如果是按照比如每秒一次的方法,那也相當於是做過採樣了。如果是按照每筆交易來記錄的,那麼每條消息的時間分布應該是不均勻的(irregularly spaced),這個時候如果你要用時間序列的方法,就需要重新採樣。根據 Nyquesit-Shannon 定理,可以求出完全保真的採樣頻率(既 Nyquesit 頻率),採樣時間間隔等於數據中兩條相鄰消息的時間差最小的那個值的一半。

但實際上因為交易數據中噪音很多,你也不一定關心真正的高頻部分,按照上面這種做法就不一定划算了,因為採樣之後你的數據量會變大很多,而且為了得到採樣值還得做很多插值工作,插出來的值也不一定對(兩條消息之間的價格就不太好插,Last Price,Mid Price,或者 TWAP 都各有各的道理,但顯然都不是完全準確的)。對於這種情況,我覺得起主導作用的還是你的關注點和策略特點。如果策略的頻率大概是每分鐘交易一次,那按每5秒或者每10秒採樣一次估計已經很夠用了,再高的頻率你也用不上(毫秒以內的波動你是不敏感的)。

這樣說是因為,交易市場始終是自頂向下由現實世界驅動的。價格是由資產本身價值驅動,而不是反過來由高頻交易者驅動價格,所以高頻的波動一般而言相對中低頻很小,忽略掉不會有什麼影響。實際上我覺得只有一種情況需要考慮高頻的污染,就是發生 Flash Crash 的時候。但這種情況實在太少見,而且一般不會反覆出現。真的遇到的時候做單獨處理就好了。

如果關心高頻,那麼處理的就是直連交易所收到的原始數據,可以完全重構 Order Book,數據量也遠超其他形式。這個時候還是根據具體問題來分析。比如你關心交易數據,那麼其他的委託修改,撤銷之類的消息都可以忽略了,一下子就剪掉很多數據;如果關心的是 Order Book 動態變化過程,所有的消息就都應該考慮,這樣當然計算量也會變得非常大。

接下來你可能考慮的就不僅僅是採樣頻率這種為時間序列技術的缺陷而妥協的方案了,可以考慮其他 irregular time spaced modeling 方法,比如 Autoregressive Conditional Duration 或者 Point Processes 之類,都可以直接在原始時間上建模。當然這個已經進入高頻的領域了。

最後還是強調,解決這個問題的思路是從需求出發,而不是保真。高頻的部分肯定是存在的,只不過看你拿不拿得到,需不需要用到而已。如果本來就是做中低頻交易,採樣隨便做做就好,幾秒鐘甚至幾分鐘采一次應該都不會有太大問題。


以外幣計價或者結算的交易,包括買入或者賣出以外幣計價的商品或者勞務、借入或者借出外幣資金和其他以外幣計價或者結算的交易。

參考:http://www.dongao.com/zjzcgl/zjkjsw/201407/171299.shtml


這個我要答一下了,呵呵

在金融市場鑽研了十多年的演算法,自認為還是有點可說的

金融市場里的波動,是市場參與者對價格的反應

如果你把一個標的的審視角度變一下

A,1分鐘圖

F,1月圖

你會看到,F更傾向於趨勢,而A更多的是隨機波動

所以,這不是信號的真與假,而是隨機波動與趨勢的比例的不同

我研究的就是如何區分單邊趨勢和震蕩


推薦閱讀:

讀金融不出國,在國內讀研有沒有出路?
想考 CFA,但无任何金融背景,该从何学起?
大陸考CFA的流程是怎樣的?
2008年美國的金融危機是怎麼產生的?有多嚴重?又是怎麼解決的??

TAG:演算法交易 | 金融 | 數字信號處理 | 量化交易 |