Redistribution Group
Brief
我發現 K. G. Wilson [1] 的 Renormalization Group [2] 可以被推廣到一個更極端的情況,我稱之為 Redistribution Group。我在 Field Theory of Data 中的所有計算都不過是 Redistribution Group 的一個具體應用。在 Renormalization Group 中,通常只是對空間尺度或者能標進行變化(或者說重新標定);而在 Redistribution Group 中,不僅時空離散化的尺度可以被任意標定,任何體積量(例如概率)都可以在時空結構中進行分配(例如概率分配)。
Redistribution Group 可能只是 Renormalization Group 的一個推廣,但是它可以被直接應用於 Volumetric Space(以及任意的 Lattice)。就這一點而言,Field Theory of Data 和 Lattice Gauge Theory [3] 居然真的有些關係。
我需要先完成 Volumetric Space 和 Field Theory of Data 的規範化,才可能系統地解釋 Redistribution Group 。不過,它的基本原理甚至比 Renormalization Group 還簡單,就是可以將一個守恆量(比如概率或其他線性量)重新分配到離散化的時空結構中,並能夠作有效理論的定量計算工具。配合最大熵原理,Redistribution Group 可以作為一個普適的計算框架。
Preview
雖然我沒有一個規範的理論,但是我可以展示一些基於 Redistribution Group 的計算結果。畢竟我是量子力學的信徒,並篤信教條 「Shut up and calculate」 。更幸運的是,我還會寫一些可視化代碼(D3js),將抽象的數據變成可以直接理解的圖像。
中國股市中的准臨界現象和相刻畫 [4](有時空的 Redistribution)
中國股市的相刻畫(僅有空間的 Redistribution)
中國股市的相刻畫(有時空的 Redistribution)
Disclaimer
我提供上述論述的主要目的是證明自己獨立完成了基於 Redistribution Group 的計算。雖然我希望我的工作是原創的,但是正如平均場論[5]被反覆獨立發現一樣,很可能有人早就做了類似的工作。但是將 Redistribution Group 應用於離散的時空結構,即 Volumetric Space,很有可能是 Lattice Gauge Theory 之外的第一次嘗試。我發現它能帶來極大的便利,能揭示被雜訊所湮沒的模式。
上述結果的數據來源於公開的 A 股日線數據,僅僅出於研究非平衡態系統的目的,請勿用於投資或其他目的。市場是一個難以預測的複雜系統,它的演化不受偏微分方程(或者隨機偏微分方程[6])制約。綜上,本文不構成投資建議。
Addendum
我在友盟的 很多產品其實都涉及簡單的 Redistribution Group,只是它們並沒有超出 Renormalization Group 的範圍。
而我在 某個回答(guang gao)中提到的 Field Theory of Data,通常都涉及時空上的 Redistribution Group。最典型的例子是我之前稱為 Spectral Model 的統計力學模型,它正是通過 Redistribution Group 將一個二元量時間序列變成了一個具有類似概率意義的時空分布,並且在它的基礎上建立統計力學模型。
我最初認為,Spectral Model 的有效性來源於量子力學的能級和譜方法。從系綜的角度,這當然是有道理的,但是現在我更清楚地看到,在時間維度上的 Redistribution Group 同樣重要。在發現 Redistribution Group 之前,我只能用 Jeff Hawkins 所謂的 Temporal Pooling 來描述我的計算工具。不難看出,Redistribution Group 這個術語比 Temporal Pooling 不知道高到哪裡去了。站在巨人的肩膀上做了一點微小的工作,請批評。[1] Kenneth G. Wilson
[2] Renormalization group
[3] Lattice gauge theory
[4] Phase portrait - Wikipedia
[5] Mean field theory
[6] Stochastic partial differential equation
推薦閱讀:
※沒學過隨機過程,直接學時間序列分析吃得消嗎?
※司馬甄姬在國戰中洛神的期望是多少張牌?
※一張五十首歌的歌單,每首歌三到五分鐘,隨機播放。至少聽多少分鐘才能有90%的把握把每首歌都聽過了?
※伽瑪分布和指數分布的關係?