用科學和智慧武裝自己

用科學和智慧武裝自己

來自專欄 NEET的糟心之路

統計學知識整理:

1.平均數:基本的統計學概念, 在目標數據中有異常值的情況下不能準確放映實際情況(例我和馬雲算平均工資)

2.分位數:

(1)中位數(Q2):將數據按照升序排序後

如果總量為奇數那麼(n+1)/2位的值為中位數

如果總量為偶數那麼(n/2+1)、(n/2-1)兩位的平均值為中位數

(2)同理計算1/4分位(Q1)數將上述的n替換為中位數從有序數列的第一位開始計算

計算3/4分位數(Q3)從中位數開始計數,取有序數列最後一位為n

(3)用四分位數識別異常值:

(1)最小估計值:Q1-k(Q3-Q1)

(2)最小估計值:Q3+k(Q3-Q1)

k值一般取值在1.5~3範圍內,k=1.5中度異常,k=3極度異常

三種常見異常值

(1)被錯誤標記的異常值(需修改)

(2)被錯誤包含正在數據集中的異常值(需刪除)

(3)反常異常值(需正常保留)

3.標準差 sigma :衡量數據的波動程度

(1)方差:M為平均數,n為總數量

(2)方差開方即為標準差

4.標準分:計算距離平均值有多少個標準差(例,用6個sigma作為質量管理標準)

公式:數據集中的x_{1} 其標準分為 Z_{1}=frac{x_{1}-mu}{sigma}

mu :平均值

sigma :標準差

概率論知識整理:

1.什麼是概率:

將事件發生的可能性量化,

即用數據數學中的比率來衡量事件發生的可能性(0%~100%)

2.如何計算概率:

(1)經驗值

(2)數據分析: 概率=事件發生數目/總數目

3.概率有什麼用:

幫助人理性做出選擇(人生很多重要的的選擇,其實就是概率的選擇)

例如,下次不再裸辭 ==!!!(老師一句,裸辭會降低智商真的扎心。。。)

4.賭徒謬論:

總結來講一句話:上把牌不好,不代表你下把牌就會好,不賭最好

(1)獨立事件:概率不受過去發生事件的影響(例,拋硬幣)

(2)條件概率:概率受過去發生的事件影響(例,摸球實驗)

應用:決策樹

5.大數定律:

(1)期望E(x)=預期值

(2) 小數定律:在統計樣本的量級不滿足實驗所需數量的情況下,那麼事件就表現為各種極端情況,不能用作推算期望的根據

(3)大數定律:在統計樣本的量級滿足實驗所需數量的情況下,那麼事件的概率分布就會呈無限接近期望的狀態(如擲硬幣,丟骰子)

推薦閱讀:

演化與性別差異
3D列印技術幫助動物交配,科技完成了生命的大和諧
原來考拉和人類的指紋最接近,幾乎完全一樣
微積分筆記1
厲害了,原來你的小妹妹是如此「威武善戰」~

TAG:科學 | 自然科學 | 數學 |