了解數據,判斷概率,做出選擇
09-23
了解數據,判斷概率,做出選擇
首先,介紹4個了解數據的工具
- 平均數:通過它能了解到一組數據的平均水平;缺點:受極端值影響,可能會給人帶來錯誤的認識 平均數的計算=所有數目的和÷總的項數 有時還會給各項加一定的權值,從而得出更加精確的加權平均數
- 中位數:顧名思義即一組有序數據的中間值,它與平均數有點類似,但它能更加準確的反映出一組數據的中間水平,且它不受極端值的影響。
- 四分位數:由上述的中位數引申而來,如果說中位數是二分之一位數,那四分位數就是四分之一位數,分為上四分位數和下四分位數。(稍後會具體講到它的實際運用及直觀反映)
- 標準差:反映一組數據的穩定程度,離散程度。數值越小表示改組數據越穩定,數據越集中,反之。 標準差的計算 如圖
標準分:可表示一個數據在整個數據集 中的位置。 標準分的計算=(具體數值X-平均值)÷標準差
由於該數值表示距離平均值多少個標準差,所以根據其結果,可以對應下圖中來判斷該數據在該數據集 中的位置
接著介紹 通過四分位數和中位數 來給人直觀反映的一個工具 箱型圖
先上圖
一組數據,最大數值與最小數值分別為上邊緣和下邊緣,然後找出上四分位數,中位數,下四分位數這3條線,中位數這條線加粗,並畫成一個矩形的樣子,該矩形的位置反映了大部分數據的所在位置。 另外,還可通過上下四分位數來算出異常值
異常值:極端(大/小)的數值;不符合該數據類別的特性的數值。對一組數據而言,一般來說要把異常值剔除。
選取一個K值,然後代入上式中算最大最小估計值,不在最大估計值和最小估計值範圍內的值即為異常值。
有關概率的一些乾貨
- 選擇比努力更重要,正確的選擇應該以概率為依據,應盡量避免自己的主觀判斷
- 賭徒謬論是指,把小概率獨立事件視為條件概率,擁有該思想的人們往往都傾向於上次的下注結果對該次的下注結果有影響
- 人在押上超過自己總資產的25%時,人類往往會變得不冷靜,失去理智的思考
- 凱利判據(適用條件,輸了本金的一無所有的賭注) f={p*(b+1)-1}/b f為該次賭注於總賭本的最佳比率 p為成功概率 b為賠率
- 保險的原則:為 足以毀掉你生活的意外 上保險
- 為大概率堅持,為小概率備份
推薦閱讀:
※為什麼原創動畫成功概率不高?四位業內大咖觀點分享 | 三文娛
※可靠性筆記(一) | 故障分布函數
※概率論面經匯總(持續更新)
※proximal gradient(近端梯度法)
※概率論學習筆記(二)