用科學和智慧武裝自己
來自專欄 NEET的糟心之路
統計學知識整理:
1.平均數:基本的統計學概念, 在目標數據中有異常值的情況下不能準確放映實際情況(例我和馬雲算平均工資)
2.分位數:
(1)中位數(Q2):將數據按照升序排序後
如果總量為奇數那麼(n+1)/2位的值為中位數
如果總量為偶數那麼(n/2+1)、(n/2-1)兩位的平均值為中位數
(2)同理計算1/4分位(Q1)數將上述的n替換為中位數從有序數列的第一位開始計算
計算3/4分位數(Q3)從中位數開始計數,取有序數列最後一位為n
(3)用四分位數識別異常值:
(1)最小估計值:Q1-k(Q3-Q1)
(2)最小估計值:Q3+k(Q3-Q1)
k值一般取值在1.5~3範圍內,k=1.5中度異常,k=3極度異常
三種常見異常值
(1)被錯誤標記的異常值(需修改)
(2)被錯誤包含正在數據集中的異常值(需刪除)
(3)反常異常值(需正常保留)
3.標準差 :衡量數據的波動程度
(1)方差:M為平均數,n為總數量
(2)方差開方即為標準差
4.標準分:計算距離平均值有多少個標準差(例,用6個作為質量管理標準)
公式:數據集中的 其標準分為
:平均值
:標準差
概率論知識整理:
1.什麼是概率:
將事件發生的可能性量化,
即用數據數學中的比率來衡量事件發生的可能性(0%~100%)
2.如何計算概率:
(1)經驗值
(2)數據分析: 概率=事件發生數目/總數目
3.概率有什麼用:
幫助人理性做出選擇(人生很多重要的的選擇,其實就是概率的選擇)
例如,下次不再裸辭 ==!!!(老師一句,裸辭會降低智商真的扎心。。。)
4.賭徒謬論:
總結來講一句話:上把牌不好,不代表你下把牌就會好,不賭最好
(1)獨立事件:概率不受過去發生事件的影響(例,拋硬幣)
(2)條件概率:概率受過去發生的事件影響(例,摸球實驗)
應用:決策樹
5.大數定律:
(1)期望E(x)=預期值
(2) 小數定律:在統計樣本的量級不滿足實驗所需數量的情況下,那麼事件就表現為各種極端情況,不能用作推算期望的根據
(3)大數定律:在統計樣本的量級滿足實驗所需數量的情況下,那麼事件的概率分布就會呈無限接近期望的狀態(如擲硬幣,丟骰子)
推薦閱讀:
※演化與性別差異
※3D列印技術幫助動物交配,科技完成了生命的大和諧
※原來考拉和人類的指紋最接近,幾乎完全一樣
※微積分筆記1
※厲害了,原來你的小妹妹是如此「威武善戰」~