標籤:

概率論中「矩」(moment)的實際含義是什麼,高階矩表示數據的哪些狀態?


因為我們常常會將隨機變數(先假定有任意階矩)作一個線性變換,把一階矩(期望)歸零,二階矩(方差)歸一,以便統一研究一些問題。這時候,在同樣期望為0方差為1的標準情況下(以下均假設隨機變數滿足該條件),隨機變數最重要的指標就變成了接下來的兩個矩了。

三階矩,就是我們所稱的「偏度」。粗略來說,一個典型的正偏度變數X的分布滿足這樣的特徵:很大的概率X會取絕對值較小的負值,但在極少數情況下,X會取特別大的正值。可以理解為「一般為負,極端值為正」。典型的正偏度投資,就是彩票和保險:一般來說,你花的那一點小錢就打水漂了,但是這一點錢完全是在承受範圍內的;而這點錢則部分轉化為小概率情況下的巨大收益。而負偏度變數則正好相反,「一般為正,極端值為負」,可以參照一些所謂的「灰色產業」:一般情況下是可以賺到一點錢的,但是有較小的概率「東窗事發」,賠得血本無歸。

四階矩,又稱峰度,簡單來說相當於「方差的方差」,和偏度類似,都可以衡量極端值的情況。峰度較大通常意味著極端值較常出現,峰度較小通常意味著極端值即使出現了也不會「太極端」。峰度是大還是小通常與3(即正態分布的峰度)相比較。

至於為什麼五階以上的矩沒有專門的稱呼,主要是因為我們習慣的線性變換,只有兩個自由度,故最多只能將前兩階矩給「標準化」。這樣,標準化以後,第三、第四階的矩就比較重要了,前者衡量正負,後者衡量偏離程度,與均值、方差的關係類似。換句話說,假如我們能把前四階矩都給「標準化」了,那麼五階、六階的矩就會比較重要了吧。

-

我曾經和@驃騎將軍 討論過類似的問題。要是把一個人的一生當作一個函數f(t)(t是時間),那麼「一階矩」(整個人生的積分,即∫f(t)dt)就可以用來衡量這一生總體是好還是壞;而「二階矩」(整個人生的平方積分,即∫[f(t)]^2dt,下同)則衡量這一生是一帆風順還是大起大落。

然而,正所謂「久入芝蘭之室而不聞其香,久入鮑魚之肆而不聞其臭」。生活條件優越(一階矩較正)的人,已經習慣了,於是一點點不順心也會當作大事;生活風平浪靜(二階矩較小)的人,則一點點起落也會表現得很敏感。於是,我假定每個人對自己人生的主觀感覺g(t),就是對f(t)做了一個線性變換以將一、二階矩都標準化。這麼看來,其實每個人的人生都差不多,一階矩都是0,二階矩都是1。

但是真的是如此嗎?後來我自己思考了一下,將一、二階矩都標準化後,下一個顯著特徵就是三階矩(∫[g(t)]^3dt)了。前面提到,三階矩比較正的,就是「一般負,極端正」。三階矩很正的人生,多為那些暴發戶,庸碌終生,顯赫一時;而是三階矩很負的,「一般正,極端負」,則可以參照那些「溫室的花朵」,平時很優越,但一次挫折就迅速毀了這個人的一生。所以不同的人生還是不一樣的吧。

-

2017-2-4補充:四階矩(∫[g(t)]^4dt)遠小於3的人生,是比較常規的,有歡笑,也有淚水,不會有什麼太大的變動,偶爾的大悲大喜也未嘗不是一份寶貴的經歷。而四階矩遠大於3的人生,則會明顯地有那麼幾次大起大落,它們對你的影響是如此深刻,以致於面對生命中其他的歡笑和淚水時,總是麻木地、帶著苦笑地一筆帶過了,絲毫無法在內心激起哪怕一絲波瀾;當回首一生,除了那麼幾個時間節點,幾乎沒有任何可圈可點的內容。這麼看來,不同的人生就更不一樣了。

-

2017-4-5補充:再提供一個理解的角度,有錯誤的話請指正:

集中收益,分散風險:正偏度

分散收益,集中風險:負偏度

集中收益,集中風險:大峰度

分散收益,分散風險:小峰度


如果讓你用4個數來概括一個分布

mean: 第一矩。表位置

variance: 第二矩。表胖瘦

skewness: 第三矩。表歪斜

kurtosis: 第四矩。表尾巴胖瘦。。。。


維基百科說的不錯,也比較容易理解。

In mathematics, a moment is a specific quantitative measure, used in both mechanics and statistics, of the shape of a set of points. If the points represent mass, then the zeroth moment is the total mass, the first moment divided by the total mass is the center of mass, and the second moment is the rotational inertia. If the points represent probability density, then the zeroth moment is the total probability (i.e. one), the first moment is the mean, the second central moment is the variance, the third moment is the skewness, and the fourth moment (with normalization and shift) is the kurtosis. The mathematical concept is closely related to the concept of moment in physics.

For a bounded distribution of mass or probability, the collection of all the moments (of all orders, from 0 to ∞) uniquely determines the distribution.


矩就是觀察與描述隨機變數的工具,不同的矩就是不同的維度。就是所謂的橫看成嶺側成峰,遠近高低各不同。通過不同維度的觀察,你就能認清你要觀察的隨機事件的特性了。比如你要描述一個隨機變數,可以使用pdf或pmf來描述分布情況,但是pdf與pmf是後驗的,是對具體隨機觀察量的抽象與歸納。那麼我們在面對一組隨機變數的時候,能為我們直接觀察到的就是這些隨機變數的各個矩。假設你是個參謀,連長讓你通過分析一個地區的炮火覆蓋情況推算出一些有價值的信息。你首先在所有炮彈落點畫了個坐標,然後開始分析一階矩。一階矩就是均值,計算以炮彈隨機落點位置的均值得到一階矩,通過算就能知道一堆炮彈打過來大概是落在什麼地方了。但是你還想知道,比如打出這對炮彈的大炮精密不精密啊?是火箭炮還是常規火炮?這就要用到二階矩,通過一階矩的觀察方法(求平均)與隨機變數本身,你就能推算出方差。注意方差不等於二階矩。通過三階矩可以計算偏度。如果你發現今天炮彈落點偏度與昨天不同,那可能是換炮手了。四階矩叫陡度。如果你發現今天的陡度與昨天不同 那可能是對方裝備了高級火控雷達或者換了個更專業的炮手。通過這麼多維度的觀察,你大概就能知道對方的火力情況。所以矩就像望遠鏡調焦,越細的維度能觀察到一些細節,但也喪失了很多全局信息。手機碼字不易,例子不一定準確,希望能幫到你。


一二三四階(中心)矩,你可以按照位置、離散程度、對稱性、長尾短尾來形成初步的印象,但是要記住:這不是在所有情況下都成立的,直覺不總是靠得住。

至於高階矩有什麼用:(一定條件下)一個隨機變數的性質可以由它的1到∞階矩唯一確定。你可以理解為:每一階矩包含了這個分布的一部分信息,所有的矩合起來就能完整地描述一個分布。你可以拿完備基(如傅立葉級數展開、泰勒/洛朗展開等)的例子來幫助你的理解。


前幾天剛好寫了一個帖子,關於矩的理解。貼在這裡。

[http://reasonw.github.io](矩的初步理解 - 求仁得仁),

zhihu也不支持直接貼markdown啊,各位直接轉過去看就行


統計上的矩可以類比物理中的矩的物理圖像來理解(如,力矩,轉矩)。矩在物理上是用於識別物體形狀分布特徵的重要參數,在統計上是識別隨機變數分布特徵的參數,比如一階矩就是統計上的均值,物理上的意義是『重心』,二階矩是是統計上的方差方差,在物理里的一個意義是描述剛體旋轉中以重心為轉軸的轉動慣量。以此類推,其他的高階矩描述的也是分布特徵,如與均值的歪斜分布情況(偏態),或峰值的分布情況(峰態)等其他方面的分布特點。


是對偏離某一值的懲罰,(中心矩就是對偏離均值的懲罰),一階矩一視同仁,二階矩懲罰增大,345以此類推。


推薦閱讀:

如何推導指數分布的概率密度曲線?
有了方差為什麼需要標準差?
數學思維與工程思維的區別與聯繫?
有哪些可以培養提高數學思維的書值得推薦?
沒接觸過競賽和建模的人,可以一天之內搞定一道數學建模競賽題嗎?

TAG:數學 | 概率論 |