如何簡明地解釋「線性回歸」「貝葉斯定理」「假設檢驗」這些術語?

用大白話(即沒學過統計學的人都能理解)解釋。 一定要通俗易懂!


你的領導給你一個任務,去調查某個地方算不算美女多的地方。當然,你的領導有自己的美女判定標準,假設評價一個女子的好看程度有三個屬性:臉蛋,身材,氣質。

首先他要給你一些例子,比如她覺得奶茶是美女,高圓圓長的一般,范冰冰長的不好看。從這些例子裡面,你大概能知道你領導的審美標準,臉蛋、身材、氣質這三個屬性大概各占什麼樣的比例。這就是回歸。如果我們最終的美醜得分是把這三個標準的結果線性相加,就是線性回歸。

現在你能夠判斷一個女子是否是美女。你來到這個地方,一連碰到5個女子,按之前的標準判斷,全是美女,那麼你會不會認為這個地方的女子全都是美女呢?一般來說不會。因為經驗告訴你,任何地方都有美女和醜女,不太可能只能出現只有美女沒有醜女的地方,這個就是先驗。如果你按這種方式思考,你會認為這個地方可能美女的比例比較高,但不會認為這裡的女子全是美女,這就是貝葉斯的思想。

最後,你的領導目的是讓你調查這個地方的美女多不多,那麼多不多最終是要有一個標準的,而你又沒有辦法遍歷當地的每一個女性。所以你肯定有一套方案,比如說隨機訪問100個女性,如果超過80個女性是美女,你就認為該地是一個美女多的地方,反之則不是。那麼之前提到的方案可以看成是一個假設檢驗。


試著回答一下前兩個

1)線性回歸(Linear Regression):假設你在紙上畫了一堆點,然後打算畫一條線,這些點到這條線的距離盡量得短。怎麼找這條線呢?方法就是Linear Regression。有了這條線,希望用它來預測之後出現的點都會在它附近。

2)貝葉思(Bayes Theorem):

假設說我知道(1)明天是下雨的機率是A,(2)明天打雷的機率是B,(3)如果明天下雨了,那麼就會打雷的機率是C。那麼Bayes表示,如果明天打雷,那麼下雨的機率是C*A/B。概括來講,就是描述如果X那麼Y的機率,和如果Y那麼X的機率之間的轉換關係。

不知道這樣講可以不?


@袁樹侖 你老邀請我回答這類問題居心何在?!害我大周末不能安心看電影!

我倒是經常嘗試跟文科女解釋這些東西,以檢驗是否能通俗解釋。

好,現在我就假想我要跟文科女解釋這幾個東西好了,說錯了也不要苛責我啊,反正是給文科女解釋的,能得到芳心就達到目的了,哇咔咔。。。

【線性回歸】

「越長大越孤單」,如果說年齡大一歲,孤單多一分的話,那這就是孤單和年齡線性回歸。

【貝葉斯】

你原來有三觀(先驗),但是當你經歷一些事後(觀察),你的三觀會被重新建立,或者被毀三觀(後驗)。

【假設檢驗】

文科女說:不把工資卡交給老婆的男人有九成可能不會成功。

我要反駁她這句話,必須得先假設她是對的。然後再按照她的說法去觀察周圍的男人,交工資卡和成功的事實都如何,並且默默地記在自己的小本上。

如果她說的這句話是對的,那麼我小本上記的結果就會很明顯,否則的話,哼哼,我就不承認她這句話!


看了三個現有回答,我想補充一點關於假設檢驗。

舉個稍微生動點的例子。

你是常年在外出差的小明,很少回家,而家有閑妻一枚。隔壁住著被女性鄰居頻頻點贊的老王。

某一次離開家二十天多天後突然回家,並沒有告知妻子,忽然發現老王也在家裡喝茶。。。

妻子解釋說,老王就是今天過來被你撞見了。

你陷入了沉思,妻子說的是不是事實呢。那不妨先假設妻子說的是真的,那這件事(你回來看到老王)發生的概率不到5%。統計學意義上,做了一次實驗,是幾乎不可能產生發生概率只有5%的事件。於是,學過統計的你,默默否定了這個可能性。。

以上過程就是假設檢驗。

假設檢驗的過程如其名,先對問題做出假設,然後計算這種假設發生的概率,如果概率低於5% 或者1%,則認為在一次實驗中不可能發生,進而否定這個假設。


推薦閱讀:

通過邏輯回歸的sigmoid函數把線性回歸轉化到[0,1]之間,這個值為什麼可以代表概率?
多元線性回歸建模如何確定選擇哪些解釋變數?
用簡單易懂的語言描述「過擬合 overfitting」?

TAG:數學 | 線性回歸 |