標籤:

第四講:概率思維及應用

《概率論和數理統計》在大學已學過,最近也看完《深入淺出統計學》。前者針對考題學習,後者為了讓讀者更好的理解,賭場的案例幾乎貫穿全部相關章節。

學完猴子老師的課程,課程中的案例基本都是與個人生活、工作以及投資相關的案例,能讓學員更好的理解外,也能很快的應用到實際生活中。

猴子老師已經講的足夠好,以下將從概率的本質如何計算概率概率的應用來總結我所學概率知識。


一、概率的本質

我們在書中或在各種公眾號文章中經常會看到這樣一句話:「選擇比努力更重要」。它是別人總結出的經驗,可道理我們都懂,但要讓自己去真正實踐,卻仍然沒有頭緒。首先面對的就是:當面對很多種可能性的時候,我們該如何權衡利弊,然後做出最好的選擇。

此時,概率就可以作為量化各種可能性的工具,用數值來表示某件事情發生的可能性。然後根據確切的數值做出有根據的決策。

概率是度量某事法師幾率的一種數量指標,統計學上用「事件」一詞表示有概率而言的任何事情。

概率的量度尺度是0—1。如果某件不可能發生,則其概率為0;如果某件事肯定會發生,則其概率為1;大多時候,我們所面對的都是介於0和1之間的概率。

概率就是這條直線上的某個數值點

二、如何計算概率

公式:

1、計算簡單事件的概率。直接套用公式即可。如拋色子遊戲中,拋一次出現6點的概率為1/6。

2、計算複雜事件的概率。除了用數據分析公式計算外,還可以在專業網站上查找經驗概率值。如計算飛機失事時座位在那個位置的乘客更容易生還,可以在相關網站上查到,座位在機尾位置的乘客生還的概率更高。

示例:如何確定猴子老師公眾號一篇文章的受歡迎度?

首先確定能體現歡迎度的指標,一般都會選擇閱讀率來計算,但很多人只是點開文章,並不能代表全部閱讀乃至喜歡。所以用分享率作為指標,讀者分享給朋友,說明該讀者已全部看完文章並認同文章的觀點。

一個月內猴子老師公眾號文章統計

從以上圖片可以篩選出分享人數最多的一篇文章為「2018年賺錢機會在哪裡?如何抓住下一波紅利」,分享概率為94/13322。而第二篇文章雖然閱讀數和第一篇沒差多少,但分享率相差一半。

三、概率的應用

學習概率最重要的就是能應用到生活中,讓每件事成功的可能性更大。例如,我們往往以為飛機是很危險的交通工具,可事實恰恰相反,統計數據表明飛機是死亡率最低的交通工具,而摩托車則是死亡率最高的交通工具。

以下將介紹幾個與概率相關的經典案例。

1、賭徒謬論

定義:絕大多數賭徒傾向於相信之前的下注結果對當前下注有影響。

理解:比如拋硬幣,連續拋了三次都是正面,然後第四次拋之前,我們傾向於出現反面的概率更大;賭博亦是如此,連續輸了幾盤後,後面傾向於相信贏的機會更大;這是一種心理暗示,有時候連自己都察覺不到,卻很容易將我們帶入誤區。而走出誤區,就需要理解獨立事件相關事件的不同。

獨立事件不受過去事件的影響。如以上拋硬幣和賭博都是獨立事件。

相關事件受過去事件的影響,可用條件概率來量度與其他事件的發生情況有關的某個事件相關的概率。

可用決策樹來求解條件概率更直觀。

示例:盒子里有兩顆籃球和3顆紅球,用概率樹求拿第2顆球的概率。

從以上圖可以得出:

決策樹:是把決策類的各個節點畫成樹的形狀,輔助我們決策的工具

畫決策樹分四步:

  • 在左側寫出想要實現的目標;
  • 在右側寫出實現它的所有方案;
  • 評估各個方案的結果及其實現的概率(要減少主管判斷偏差,從外部視角評估);
  • 做出決策。

2、大數定律

  • 大數定律:如果統計數據足夠大,那麼事物出現的頻率就能無限接近他的期望值;
  • 小數定律:如果統計數據很少,那麼事件就表現為各種極端情況,而這些情況都是偶然事件,跟它的期望值一點關係都沒有。

在生活中我們總是存在很多偏見,比如認為河南騙子多;比如相信中醫(不能被證偽);這些都是小數定律給我們的誤導。應用大數定律得出的結論相對客觀,更接近期望值,而期望值是可以量化,可以計算的。

期望:是試驗中每次可能結果的概率乘以其結果的總和,它指示預測結果。本質是概率的平均值,用於判斷一件事的投入成本和收益是否值得做。

公式:

示例:計算拋色子的期望

當做一件事之前,初步判斷收益大於成本時,我們就可以做更進一步的考慮。

3、預防風險

雖然我們可以用概率來判定事件的可能性,可仍然不代表不會發生最壞的那種情況。所以我們在重大事件上需要預防風險,以免遭受不可挽回的損失。

主要需要預防資本安全人身安全

  • 資本安全:永遠不要押上全部。投資的目的是獲得最大化收益和降低系統化風險。
  • 人身安全:為足以毀掉生活的意外上保險。除社保外,需優先購買重疾險和人身意外險。

總結:

學習概率知識幫助我們識別生活的誤區,幫助初步判斷做一件事的可能性。然後我們要做的就是在大概率事件上持續投入,為小概率事件備份,終會獲得不錯的回報。


推薦閱讀:

kaggle:員工離職情況分析(R語言)
SparkSQL數據分析項目---性能調優
【文本分析】利用jiebaR進行中文分詞
打造自身長板- 學習數據分析,實現轉型之路(第一篇)
【客戶案例】脈車人CRM的選擇:兩周內打造決策分析能力

TAG:数据分析 |