如何理解隨機變數序列?X和x有什麼區別?
舉兩個例子來說
1:擲骰子。 很明顯,每一次擲骰子的結果都符合樣本空間 S = {1, 2, 3, 4, 5, 6 }。 X1 是你第一次擲骰子的結果,X2是你第二次擲骰子的結果……Xn是你第n次擲骰子的結果……而這些結果組成的集合就是隨機變數序列。
如果這個隨機變數序列是有限的,例如,X1 = {3}。 X2 = {2}。那麼這個隨機變數序列就是{3,2}
它也有可能是一個無限的序列{1,5,4,6,3, …, x } ( x belong to S) 。
2:Dota 選英雄。我是一個Dota骨灰級玩家,這裡假設我每天只打一把Dota。 眾所周知,打Dota都是要選英雄的,在Dota6.68時代,一共有108個英雄。 它們組成了我的樣本空間S。
S ={船長,獸王,半人馬酋長,撼地神牛,全能騎士,熊貓酒仙,流浪劍客,山嶺巨人,牛頭人酋長,樹精衛士,精靈守衛,鍊金術士,...太長了不列了...}
我周一刀了一把,為了開局能多250金我使用了隨機選擇, 選到了炸彈人, 所以,這個X1就等於炸彈人。 周二的時候我隨機選到了JB臉, X2 = {JB臉}。 周三的時候終於隨到了天災地區我最最最最喜歡的英雄美杜莎, X3 = {美杜莎}。 周四......
於是,我每天打Dota所選的英雄組成的集合就是這個隨機變數序列{炸彈人, JB臉, 美杜莎.......}
畢竟,現在都是DOTA2時代了,為什麼我還要舉Dota6.68作為例子呢。首先,舉這個例子可以裝逼,說明我是一個DOTA資深玩家。 另外我還想說明的是,現在DOTA2一共有110個英雄,比Dota1足足多了12個,並且很多英雄都有所調整, 比如整容成功什麼的……所以現在這個樣本空間已經與原先不一樣了,我每天玩Dota所選的英雄組成的隨機變數序列已經是另一個隨機變數序列了。
---------------------------------------------------------------------------------------------
至於X和x,X是隨機變數。 x是具體的值。 譬如上述刀塔例子中,Dota6.68的所有英雄是我的X, 我周一選的炸彈人則是x。
以P(X = x)為例,P(X = 美杜莎)代表著我選到天災地區我最喜愛的英雄美杜莎的概率。
希望有所幫助。
最近學統計機器學習複習概率論中
說說個人看法:隨機變數(變數就是特徵)指的是在特徵空間中特徵取值(就是所謂的事件)的不確定性,其對應的是分布律(對應於離散變數)或者是概率分布 是客觀存在的而變數序列就是一次次的隨機實驗的結果在特徵空間中的位置分布狀況,當變數序列的長度為無限長(就是實驗次數無窮多)的時候構建出來的特徵空間中的結果就無限接近於客觀存在的分布律或者是概率分布了
相當於是當序列無限長時,用全體實驗結果(變數序列)在特徵空間中的分布狀況去近似等同於概率分布了 就是用頻率去估計概率
大數定律就是將隨機變數(相應於概率或者分布律這種整體的很虛幻的存在)和隨機變數序列(一次次的實實在在的隨機實驗結果來對應頻率,體現實驗結果在特徵空間分布情況)聯繫起來,當實驗次數(隨機變數序列長度)趨於無窮時,就用很實在的實驗結果在特徵空間的分布去擬合比較虛的隨機變數分布律或者是概率分布
總結下隨機變數相應於客觀存在的特徵空間分布情況
隨機變數序列就是做一次次實驗將所有結果記錄在特徵空間中
概率分布我們直接是求不出來的,所以用隨機變數序列(實驗結果在空間的位置)來接近概率
大數定律是連接概率論和數理統計的橋樑,概率是客觀存在但是直接求不出來的,而我們通過大數定律這個依據使用隨機變數序列(數理統計,實驗結果在特徵空間的分布)來估計隨機變數的分布狀況,實質也是一種擬合方法推薦閱讀:
※Logistic 回歸和費米分布有什麼聯繫嗎?
※如何理解並記憶大數定律?
※第一類錯誤和第二類錯誤的關係是什麼?
※如何優化邏輯回歸(logistic regression)?
※如何評價airbnb的data scientist實習項目水平?