標籤:

一道關於疾病檢驗的概率的問題?

A女士懷疑自己得了某種肝炎,希望在醫院做一次檢測。醫生告訴A女士,她所屬的人群得此種肝炎的概率僅有千分之一。但A女士不放心,還是堅持做了測試。然而很不幸,測試結果為陽性。現在已知測試儀器的正確率為95%,那麼A女士確實得了肝炎而非誤診的概率為多少?

我個人傾向於95%,有答案說不到2%,到底哪個是正確的?如果2%正確,那世界上還要檢驗學幹嘛?


感覺題主的這個問題還是很有代表性的,所以我用不同的思路講一講。我先舉兩個極端的例子,讓題主接受 95% 的荒謬性,然後再告訴題主 95% 準確率的意義在哪。

變形一:假設整個地球有一百億人吧,突然有一天一個外星人閑的沒事幹在地球上隨機投放了一塊外星毒藥,恰好有一個地球人感染了。聯合國趕緊派全世界的科學家進行研究,最後發明了一台儀器,這台儀器診斷的準確性是 99% 。現在的問題是:如果一個人被儀器檢查出來被感染,那麼他實際被感染的概率是多少?

事實上,我們可以估計出大約有一億人會被診斷出被感染,按照題主的想法,每個人感染的概率都是 99% 。然而,全世界只有一個人被感染,而這樣算會有平均九千萬人感染。所以 99% 肯定是荒謬的。

變形二:我們還是假設疾病的發病率為千分之一,但是儀器的準確率為 50%.現在你遇到了一個儀器檢查你得病了,你認為你得病的概率為 50% 。但是實際上,我並沒有用儀器對你進行檢查,而是扔了一枚硬幣,正面向上我就說你感染了,反面向上我就說你沒感染。但是對於你來說,是無法區分扔硬幣和儀器檢查的。因為兩種情況的準確率都是 50% .所以你的結論就是:每個人得病與否不需要儀器檢查,扔硬幣就可以決定了。

如果題主接受了這兩個變形的荒謬性,自然會問那 95% 的準確率檢查出來的結果,你告訴我只有不到 2% 的準確性,那這儀器有什麼用啊?事實上,儀器的作用就體現在這 2% 里。試想當你沒有檢查的時候,你得病的概率是千分之一,但是現在變成了接近百分之二,提高了二十倍!如果儀器的準確率是 99%, 你得病的概率就是10%,提高了一百倍左右。

也就是說,儀器的準確率雖然很高,但由於實際上得病的概率太低,所以最後你得到的生病概率也不會特別高,但實際上,儀器的確診已經讓你得病的概率比人群中的自然發病率高得多了,這也就是儀器準確率的體現。


不到2%是對的

這題的考點是貝葉斯公式,先驗概率,後驗概率

我的答案是大約1.8%.

嚴謹的數學計算

設事件B是檢驗陽性,事件A是患病,A",B"分別是AB的對立事件

由全概率公式 P(B)=P(B|A)*P(A)+P(B|A")*P(A")=0.95*1/1000+0.05*999/1000=50.9/1000

由貝葉斯公式 P(A|B)=P(B|A)*P(A)/P(B)=0.95/50.9=0.01866

不嚴謹的計算

假設有100000個A女士,那麼其中有100個患病

這一群A女士做檢查,沒患病但是陽性的有99900*0.05=4995

患病且陽性的有100*0.95=95

也就是說陽性的人有5090人

陽性且患病的概率是 95/5090=0.01866

雖然數能算出來,但我十分理解題主內心的感覺,因為我第一次學的時候也感覺很詫異。下面我試著去解釋下。

你覺得相對於95%來說,2%簡直太小了。那我告訴你,我甚至有辦法把2%降到0%!

很簡單,如果這個疾病根本不存在,那麼檢驗為陽性的人肯定沒有患病,這種檢驗的正確率就是0%。

我再來換一個方法

比方說在一個男女比例極度不平衡的學校里,該校有女生100000人,男生100人。

女生有95%的人穿裙子,5%的人穿褲子,男生5%的人穿裙子(女裝大佬),95%的人穿褲子

現在你看到了一個人穿著褲子,那麼他是男生的幾率是多少?

少的可憐。原因在於女生是實在是太多了,儘管女生穿褲子的很少,但是因為總人數眾多,仍然有5090名女生穿褲子。而男生實在太少了,儘管男生穿褲子的比例大,也只有95名男生穿褲子。

把上面的問題換成題主的問題,因為不患病的人實在太多了,遠遠大於患病的人,所以陽性且患病的概率就小到反直覺。

至於你說的檢驗學有沒有必要的問題

當然是有必要的。

1.如果結果是陰性那基本必然排除她的患病可能,這就是該檢驗的一個作用。

我們假設A女士檢查是陰性,那麼她不患病的概率是多少?

設事件B是檢驗陽性,事件A是患病,A",B"分別是AB的對立事件

由全概率公式 P(B")=P(B"|A)*P(A)+P(B"|A")*P(A")=0.05*1/1000+0.95*999/1000=949.1/1000

由貝葉斯公式 P(A"|B")=P(B"|A")*P(A")/P(B")=949.05/949.1=99.995%

所以說,如果檢驗是陰性,那基本必然排除她的患病可能。

有點類似於寧可錯殺一萬,不可放過一個。

2. 一般來講,這種檢驗結果出了陽性之後,是要接著做更精確的檢驗的。如果這種檢驗很便宜,而精確的檢驗很貴,那麼先用這種檢驗篩一遍顯然省錢呀。


前面已有的回答都很好,使用貝葉斯公式計算出不到2%的概率也是正確的,我就過來講點別的。

一般來說,對於這類二分類的問題,我們關心的性能指標不僅僅是在全部樣本上的正確率,還有一些其他的指標。

具體在這個例子裡面,我們可能還關心:

  1. 在所有被檢測出疾病的人裡面真正患病的概率
  2. 所有患病的人被檢測出患病的概率

也就是機器學習里經常講的precision和recall。題目所關心的其實就是precision。

光說95%的準確率的信息量是不足的。所有患病的人被檢測出患病的概率是多少呢?所有沒有患病的人被檢測出不患病的概率是多少呢?這兩個數一般來說是此消彼長的。如果你什麼都不告訴,那一般只能認為這兩個值都是95%。然後就有了用貝葉斯公式得到2%的結果的計算。

所以其實實際中的疾病監測的precision並沒有這樣算出的2%這麼不堪……


你們的回答通通沒解答題主的問題!到頭來還得靠我!(我輸了,我也沒解答題主的問題……)

看了題主 @yilin wang 自己的回答,大概知道題主的問題在哪了。細究有很多,大的方向有兩個,一個是概率上的,一個是檢驗上的。不過很多都是常見的大多數人都會犯迷糊的問題,所以說,概率論是一門有必要好好學習的學科。

我先說個最近發生的事。我平時玩卡牌遊戲(爐石傳說),前天,看某主播直播。主播喃喃自語,現在牌局裡只剩下剩下5張(不重複的)牌,想抓到其中一張牌(爆牌魚)的概率是多少?多少?五分之一,20%!啊!沒抓到!臉太黑了!

然而這個時候出現彈幕說,不對,概率是50%!主播想了想,說好像也有道理啊!

這個道理在哪裡呢?就是你下一抽,無非就兩種情況,一種不是爆牌魚,一種是爆牌魚。你看,一共兩個情況嘛!其中一個發生的概率是多少?50%啊!還用想嗎?

人的物理性質決定了,他只有生病和未生病兩種狀態,也就是說,如果我們不知道他的其他信息,這個人檢驗前,生病的可能性就是50%,人群的患病率和他沒有關係,別人生病是別人的事情,和他沒有關係。

高,實在是高。數學老師哭暈在廁所。

考慮到很多人不玩爐石傳說,我這裡換成撲克。好的,這裡有一疊撲克,你現在開始摸牌。

對啊,下一張牌是不是大王,和其他的牌有卵關係?你要拿的下一張牌,就那麼明明白白擺在那裡,它是什麼牌是早就印刷好了的,是其物理性質決定的,不由其他的牌也不由你的意志而改變的,很難理解嗎?所以,因此,就只有是大王和不是大王兩個情況,概率都是50%。剩下兩張牌的時候,摸到大王可能性是50%,54張牌的時候也是50%,總之呢,就是50%,簡直完美。

你發現問題了嗎?發現問題了嗎?

另外你的問題中,有一個很關鍵的點叫做正確率。我不得不說,我沒見過哪個檢測疾病的正規說法里會提「正確率」的。我聽到的都是什麼假陽率,漏診率,誤診率諸如此類的。

先跟你說一下為了衡量一個檢測手段的效用,我們提出了多少標準,不是一個「正確率」可以泛泛談之的。比較常用的大概有:靈敏度和特異度,漏診率和誤診率。簡單的說,靈敏度100%就是,對A很靈敏,有A它就有反應。這就是靈敏的意思。特異呢?特異度100%就是說,對一切不是A的東西都沒反應。這就是特異的意思。在疾病檢測里,靈敏就是,有病能測出,特異就是,只有有病的才能測出,也就是,沒病就測不出。依次類推,不難理解靈敏度XX%,特異度YY%的具體意思。

誤診率和漏診率呢?A、B、C、D為下列各種情況的例數,A是患者被診斷為陽性的例數,即真陽性;B是非患者被診斷為陽性的例數,即假陽性;C是患者被診斷為陰性的例數,即假陰性;D是非患者被診斷為陰性的例數,即真陰性。

誤診率(%)=B/(B+D)×100%

漏診率(%)=C/(A+C)×100%

好了,現在再來看看你說的「正確率」。

正確率在沒有特別定義的情況下說的顯然是這麼一個意思——我測了很多個,這些人中我測對的佔95%。

這很難嗎?我對多種疾病的診斷正確率都在99.99%以上,幾乎隨便來個人我都能給出正確的診斷結果。這些疾病包括但不限於 三甲基巴豆醯輔酶A梭化酵素缺乏症、Menkes氏症候群、貝克氏肌肉萎縮症 等等罕見病。我只要見到人就說沒這個病,正確率幾乎就是100%啊。回到你的問題,對一個千分之一概率的疾病診斷正確率才95%,如果僅僅只有這一個信息,這機器/試紙根本就沒有用,對這個疾病的檢測結果基本毫無價值,這麼說你明白了嗎?

正是因為靠「正確率」判斷有效性是根本不夠的,會有這樣那樣的問題,才有那麼多標準,那麼多衡量方式,各自都說明了不同的問題。進而更深入的,就有了檢驗學這門學問。你的問題到這裡應該得到完整的解答了。

另外,讀那種漏洞百出的文章要多留個心眼。其實有時候我也會讀一些,其中的邏輯、思路、包括遣詞造句方面,都是令人非常無語的,但我為什麼有時候會去看類似的文章呢?其實和刷知乎是一樣的,天馬行空的內容自有其神奇的魅力。不過很高興你能問這樣的問題,說明你還是願意學習新東西的。不過如果要搞得更清楚,建議從頭看教材。


這個問題我在我的科普文章里有討論過,歡迎題主及各位閱讀:

https://zhuanlan.zhihu.com/p/25711242

-------------以下為引用---------------

10000人去檢測某種發病率1%的疾病,如果某人確實生了這個病,有90%的概率會被檢出陽性;如果某人沒有生病,有9%的概率會被誤檢出陽性。現在甲被檢出陽性,請問他得病的概率是多大?

請先自己思考一下再往下看。

這是一個答案很反直覺的問題。有10000人去檢測,100人是實際得病了的。在這100人中,90人會被檢查出來陽性。9900人是健康人,在他們之中,9%,即891人會被檢測出陽性。最終,有981人檢測呈陽性,其中只有90人,即9.2%的人是真得病了。代入貝葉斯定理,A = 得病,B = 檢測呈陽性:

(2.6) P(A|B)={P(A)*P(B|A)}/{P(B)}

P(A)= 1%,P(B|A)=90%,P(B)=981/10000=9.81%。得到的P(A|B)和上文是一樣的。這個檢測非常不靠譜。為什麼?很顯然,是因為健康人基數太大了,即使9%不是一個很大的數字,也會產生大量的假陽性。

那麼,我們可以反過來問,這個檢測要達到一個什麼標準,我們才能投入使用呢?我們假設我們希望「一個人如果被檢出陽性,那麼他有95%的可能是真的得病了」。這是我們的目標。如果得病,90%概率被檢出這一點不變。帶回貝葉斯定理,P(A|B)=95%,P(A)= 1%,P(B|A)=90%,得到P(B)=0.947%。10000人檢測,94.7人呈陽性,其中90人是真得病了。假陽性的概率為4.79900=0.048%。

---------------------------------------

我認為說理還是@王希 說得更清楚接地氣,想多看一個例題的話就看我這個吧。


我基本支持@彭銘燃 的答案,只不過這道題不用貝葉斯也可以解釋。我嘗試用較少的篇幅解釋一下。

首先這道題有不嚴謹的地方,就是單純講正確率(Accuracy)並沒有意義,需要兼顧特異度和靈敏度,我會在下面說明。

假設我們要開發一種試劑來檢測某種疾病,為了測試這種試劑的可靠程度,我們請來100名患者和100名健康人,用試劑進行檢測。結果如下:

這裡簡單介紹這四個值是什麼意思:

靈敏度=患病者被檢測為陽性的比率

特異度=未患病者被檢測為陽性的比率

PPV=檢測為陽性者患病的比率

NPV=檢測為陰性者患病的比率

(為什麼說題干不嚴謹呢?因為正確率是指(患病且陽性+未患病且陰性)/全部人數=90%。而患病且陽性和未患病且陰性的人數未必相等,比如可能前者為100,後者為80,這樣正確率仍然是90%。@彭銘燃 的計算是默認了靈敏度=特異度的結果。不過這裡我們為了方便起見,可以就設定正確率=靈敏度=特異度=90%)

所以問題來了,假設讓你選指標來說明試劑的效力,你會選右邊那組值呢,還是下面那組值呢?

從直觀體驗來講,當然是下面那組更直觀啦。你看,檢測為陽性的,裡面就有高達90%的病患,這不正說明我們的試劑很有效嗎?

問題是,現實中,患病者與正常人的比例是1:1嗎?讓我們看看把試劑應用於現實,會造成什麼樣的後果。假設患病者佔全部人口的1%,而人們選擇去醫院做檢查完全是隨機的(這點不符合現實,只是為了簡化問題)。並且,理所當然地,試劑的特異度和靈敏度並不會隨著檢測人數的多少而改變。可推知,當我們將試劑應用於10000人時:

雖然NPV上升到接近100%,但是PPV降到了慘不忍睹的8%。也就是說,如果我們的試劑真的用於現實,那麼檢測為陽性的人只有8%的幾率為患病者,這顯然十分糟糕。

所以,一個重要的結論是,PPV和NPV會隨著分布(比如患病者和正常人的比率)不同而變化。這也是為什麼所有檢測手段都要用靈敏度和特異度來衡量而不是PPV和NPV的原因。

那怎麼辦?

思路一,提高特異度。如果我們盡量提高特異度,提高到接近100%,這樣假陽性(未患病且為陽性)的數量就會大大減少,現實中的PPV就能大大提升。但問題是,靈敏度(Sensitivity)和特異度(Specificity)的關係往往是這樣的:

一個增加,另一個就會減少。如果我們要求特異度很高,接近100%,這時靈敏度就會下降到50%以下,導致至少有一半患者無法被檢測為陽性,這顯然不能滿足要求。

思路二:使用更多種類的試劑。如果我們能多使用一種試劑會怎樣呢?假設這種試劑的靈敏度和特異度也是90%,且結果獨立於上一種試劑的結果,當兩種試劑都為陽性時判定為陽性,否則為陰性。那麼合併起來,靈敏度就是0.9*0.9=0.81,特異度就是1-0.1*0.1=0.99。看起來蠻不錯的,然而乘以龐大的正常人口基數,PPV仍然偏低(45%),不過比起只用一種試劑而言已經提高不少了。

沒關係,繼續增加試劑的種類。

當使用三種時,靈敏度=72%,PPV=88%

當使用四種時(任意三種陽性即為陽性),靈敏度=95%,PPV=72%

當使用五種時(任意四種陽性即為陽性),靈敏度=92%,PPV=95%

所以結論就是,使用多種手段進行診斷,而不僅依賴一種手段,是提高疾病診斷可靠性的根本途徑。


上面的正確回答已經很多了。但我決定用最淺顯易懂的方法來說明一下,不用貝葉斯公式。

首先假設有一個20000人的群體,A女士是其中某個人的概率是完全相等的

根據是否健康以及檢驗是否正確,會有以下四種可能。其中標黃的意思是檢驗結果為「得病」的人群,一共是1018人。

我們把這1018人挑出來,而A女士是其中任何一人的概率也是完全相等的。「檢驗」的這個操作只是告訴我們A女士不在那8982人以內。

所以最終的答案是1.87%。


設人群患病率=x,儀器正確率=y=1-z,x=0.1%,z=5%
則A女士確實得了肝炎而非誤診的概率為
P(+)=xy/(xy+(1-x)(1-y))≈x/(x+z)≈2%
所以一般我們需要再做檢測才能確診。

如果第一次為陰性,A女士患病概率為
P(-)=x(1-y)/(x(1-y)+(1-x)y)≈xz≈0.005%
此時基本可以認為沒有患病。

如果第一次為陽性,第二次為陰性,則
P(+-)=x
等於白檢測了。

如果兩次均為陽性,則
P(++)=xy^2/(xy^2+(1-x)(1-y)^2)≈x/(x+z^2)≈30%
A女士有很大概率患病。

如果還不放心,可以再做檢測。 對於發病率很低的疾病的檢測常常會出現這種情況,這是因為測試的準確率難以靠近 100%, 而較為可靠的方法就是進行多次檢測。在多次檢測結果中陽性次數-陰性次數達到
log(x/19)/log(z)
次時, 確認為陽性的概率達到 95%. 而只要陰性次數超過陽性, 即可認為是陰性。

本例中,log(19x)/log(z) ≈3,此時A女士患病率將高達87%,基本確診。


真的是2%,2%,2%。


A女士是否得病未知僅知道結果陽性。由此推出A女士得病概率95%顯然有失偏頗。

根據題目條件,在檢測結果出來之前 我們可以預測4種結果。

A病,陽性;A病,陰性;A無病,陽性;A無病,陰性。

已知結果為陽性。則得病概率顯然是第一種與第一種和第三種概率和之比。

具體計算就不贅述了。

至於結果為什麼和普通認證不同,原因在於誤診率太高 5%的誤診率放在現實生活中這家醫院分分鐘關門。

如果誤診率達到萬分之五或以下,結果還是比較有說服力的。 但也不是直觀的機器誤診率。


就是不到2%,涉及到先驗概率和後驗概率的問題

如果不想看公式,可以舉個例子:

1000個人里有999個好人,1個反革命。

某年的某次運動,999個好人里有50個倒霉蛋被打成了「反革命分子」,這樣就算你能把真的反革命逮捕了又如何?

錯殺50也不放過1人?

原題中檢測到的陽性,就是那被逮捕的51人。可惜這其中大部分都搞錯了。

題目中95%的正確率,也就是5%的失誤率,其實隱含著兩重含義:陽性誤測為陰性(也就是漏網之魚)的概率和陰性誤測為陽性(也就是冤假錯案)的概率皆為5%。問題就在於後者的概率太高了。


假設有1000個人,那麼理論上應該有1個帶病。但這個檢測方法,能給出50個人帶病。顯然1/50是檢測對了,49/50都錯了。

為什麼檢測結果這麼離譜?當然是因為千分之1和百分之5這兩個係數。第一個數越小,那麼第二個數要更小,才能有較可靠的結果。一般要想有較可靠的結果,第二個數怎麼也要比第一個數小100倍。


雖然我也學過統計,但是看到這題還是愣了一下……

最後意識到,

這tm是個文字遊戲而已啊!

原文問「A女士確實得了肝炎而非誤診的概率」,這是一個病句,因為得了肝炎和誤診並不是相反的關係,事實上就不是一類東西。

在這種情況下,我們就會自動腦補問題的重心,這時候就出現了分歧:到底是「A女士被診斷為得了肝炎的情況下確實得了肝炎的概率」還是「A女士沒有被誤診的概率」。

前者是低於2%,而後者就是95%。


關於貝葉斯陷阱,上面大佬們的答案都說得很詳細了。我這裡提供另一個有趣的point。我們知道,測試一次陽性結果,真正得病的概率為: P(H | E) = frac{P(E|H)*P(H)}{P(E|H)*P(H)+P(E|overline H)*P(overline H)}=frac{0.95*0.001}{0.95*0.001+0.05*0.999}=0.018664approx 1.87\% 假設進行第二次測試,第二次測試與第一次測試是相互獨立的,那麼如果第二次測試仍為陽性,得病的概率是多少呢?

P(X | E) = frac{P(E|X)*P(X)}{P(E|X)*P(X)+P(E|overline X)*P(overline X)}=frac{0.95*0.0187}{0.95*0.0187+0.05*0.9813}=0.265824approx 26.58\% 你看,準確率瞬間提高了14倍多。事實上,醫學上的這種檢驗一般準確率至少也是99%以上。這樣的話第一次陽性結果得病概率為

P(H | E) = frac{P(E|H)*P(H)}{P(E|H)*P(H)+P(E|overline H)*P(overline H)}=frac{0.99*0.001}{0.99*0.001+0.01*0.999}=0.090164approx 9\%

第二次測試陽性結果得病概率則是

P(X | E) = frac{P(E|X)*P(X)}{P(E|X)*P(X)+P(E|overline X)*P(overline X)}=frac{0.99*0.09}{0.99*0.09+0.01*0.91}=0.907332approx 91\%

這樣一看,是不是理解了為什麼醫生經常要求患者進行複查了呢?

P.S. 現實生活中,千分之一的發病率其實是很高的發病率了,尤其是遺傳病,所以各種儀器的檢測準確率通常要求遠高於99%


假設靈敏度和特異度都是95%(前者是d/(b+d),後者是a/(a+c))

則從屬於0.1%患病率群體、檢測顯示陽性的個體患病的概率確實只有1.87%。違背直覺,主要是由兩種測度的定義不清所致。

使用此種錯誤率檢測法的意義只有可能是排除,但存在很大風險,我個人認為不會被臨床採用。如果顯示陰性,確無患病的概率約是99.9947%(注意,這並不代表該檢測的風險很小,這只是普通人群的「漏診率」,而非對患者95%的漏診率),基本上無須做進一步檢測;而如果顯示陽性,則必定須做進一步檢測。

假設該檢測成本c1,進一步檢測成本c2。採取此種檢測,成本c1+(0.999*0.05+0.001*0.95)c2=c1+0.0509c2。不採取此種檢測,成本c2。節省c2-0.9491c1。當然,如果該檢測針對普通疾病,成本和漏診風險期望的權衡取捨也並非完全不可能。


應該是算在所有結果為陽性的裡面有多少可能是機器是準確的。因此答案為p(女士得了病且準確)/(p(女士得了病且準確)+p(女士沒得病且不準確))

最後答案約為0.0187


這是一道典型的貝葉斯陷阱問題。利用程序來推導答案。

PA = 0.001 # 假設PA為正常患病概率
PB_A = 0.95 # PB是儀器檢驗為真
# PB_A在患病的情況下,儀器測出的概率

for i in range(4):
PB = PB_A*PA + (1-PB_A)*(1-PA)
# PB檢驗為真有兩種情況(患病檢測正確,未患病檢測錯誤)
PA_B = PB_A*PA/PB
# 貝葉斯公式
print("第%i次檢查的能夠推斷患病的概率是%f" % (i+1, PA_B))
# 假設病人不相信這一次的檢查,又去檢測了一次仍然為真
PA = PA_B
# 將前一次得到的概率作為下一次的先驗概率

可以得到結果

可以看出來,第一次檢查的患病的概率不足2%,但是隨著檢查數的增加,患病的概率大幅度的增加。

對於結果我們可以這樣理解:假如有1000個人,按照發病率千分之一,可以推知有1個人得病,而按照5%的差錯率,有50未患病的人被診斷成了患病,這樣的話,1000個人中可能有51個人被檢測出患病,但是實際只有一個人患病,患病的概率是1/51=0.0196,這裡忽略了兩種情況互相的影響,所以與前面的概率略有出入,但是通過這樣我們可以很清楚的看到貝葉斯公式的正確性。

最後把第二種準確計算的方法也寫出來吧。

no_dis = 999*0.05
# 這裡計算還是不夠準確,no_dis只取期望
yes_dis = 1*0.95
p = 0.95*0.05*(1/(no_dis+yes_dis))+0.95*0.95*(1/(no_dis+1))
print(p)
# 輸出結果是0.018646646911047657 經過簡單近似後,誤差已經可以接受。


學習了高票答案,我突然發現一個有趣的事情:

如果說機器的檢測成功率是100%,確診的可能性就是100%;

但如果機器成功率達到99%

99900*0.01=999

100*0.99=99

999+99=1098

99/1098=0.09

如果機器成功率有98%

則有98/2096=0.046

也就是說,正確率98%的機器確診率也只有4.6%,正確率高達99%的機器確診率只有9%,而正確率100%的機器確診率就直接從9%跳到100%

還真是違背直覺啊………


我覺得題主是不是一開始就把機器的正確率當成了呈陽性的人實際患病的概率?


貝葉斯公式各位都說得很清楚了。對題主最後一句補充一點:在檢驗學裡,一種方法如果有5%的假陽性率,是斷然不能只用此方法確診罕見病的。


推薦閱讀:

為什麼醫生避免用概率來說明病情的發生概率?
一個賭博機器,玩家只能選押大或者押小,大小概率各為1/2,賠率1:1,最高下注2000元,以下玩法如何?
如何計算:2^100000000/C(100000000,50000000)?
概率密度函數是概率分布函數求導嗎?
兩個獨立事件都發生的概率為什麼等於兩個事件發生概率的乘積?

TAG:數學 | 概率 |