一道突然想到的概率題,如何解決?
設x=a*b,y=c*d,a、b、c、d的範圍都是1-100的隨機數字,如果已知a>c,則x>y的概率是多少?如果a、b、c、d都是1-n(n為任意固定的自然數且大於2)的隨機數字,概率又是多少?(a、b、c、d都是某個範圍隨機的數字)
離散情況很不好做,因為這樣的條件會在概率空間中划出一道參差不齊的邊緣。
不過n足夠大的時候,可以用下面的連續情況來近似。連續情況:設獨立,且均服從[0,1]上的均勻分布,求條件概率。
同樣設,則v的分布跟u相同且獨立。
所求條件概率為離散的情況極限還是3/4的.
@王贇 Maigo給出了連續情況的答案,但是我想出了一個更簡單巧妙的方法。P(ab&>cd | a&>c)=P(ab&>cd 且 b&>d | a&>c)+P(ab&>cd 且 b&<=d | a&>c)注意到 P(ab&>cd 且 b&>d | a&>c)=P(b&>d | a&>c)=P(b&>d)=1/2第一個等號是 a&>c b&>d 則必然ab&>cd, 第二個等號是a,b,c,d的獨立性P(ab&>cd 且 b&<=d | a&>c)=P(ab&>cd | a&>c,b&<=d)×P( b&<=d)=1/2 * 1/2 =1/4第一個等式是貝耶斯加a,b,c,d的獨立性,第二個等式是對稱性所以答案就是1/2+1/4=3/4
利用對稱性算出來的x&>y與x&
對於情況比較複雜,考慮x&>y的時候,a,b,c,d有以下幾種情況
(a&x=0.0
y=0.0
n=100
for c in range(1,n):
for a in range(c+1,n+1):
for b in range(1,n+1):
for d in range(1,n+1):
x+=1
if a*b&>c*d:
y+=1
print x,y
print y/x
跑一次連五分鐘都不到……
x是取值的可能情況總數,其實就是99*100/2*100*100y是記錄ab&>cd的情況(99*100/2是a,c可能取值的總數)以下是輸出結果:49500000.0 37238210.0
0.752287070707
根據需要修改n=2,3,4,5,6.....
n=3時取得最大值,為0.777778同時根據 @王贇 Maigo、 @王芊和 @德然 的回答,此概率會隨著n變大貼近於0.75.離散情況確實如 @王贇 Maigo所言不太好算。
但是不好算我們就不弄了嗎?不不不我們的態度還是要認真一點的。
但是不好算那要怎麼算呢?於是我就用了當初科學家們用過的最笨的辦法,我們就來做一遍數一數x&>y出現的次數不就好了(*/ω\*)
嗯下圖是不到8000次的結果,接近於0.75。離散情況與 @王贇 Maigo@王芊@德然 連續情況的計算結果相近
先挖個坑,電腦還在跑。更新中...-----------------------------------------------------------------第一次更新分割線-------------------------------------------------
嗯現在是跑了8*10^4次。然而結果略有點出乎我的意料,先上圖--------------------------------------------第二次更新------------------------------------------------------------------------------
所以看來第一個辦法太傻了。用matlab直接遍歷了一遍所有可能,理論結果應當是0.7523。第一個程序跑到16*10^4左右了,結果也逼近了理論結果當前結果為0.7527。不想跑了。。。本本渣渣開始發熱了w(?Д?)w
理論上而言離散結果肯定是要比連續結果來得大的。因為在離散情況當中所謂的a&>c實際上應該為a&>=c+1;而連續情況中a&>c的計算結果與a&>=c的結果是相同的。所以這是整整相差了1個單位的長度。當n取更大的時候(例如n取100000000),由於1相對於n而言小了很多,結果也就越接近於連續情況。
相反,當n取得越小,這個單位長度的影響也就越大。n=3時為7/9,n=2時更容易計算,因為a只能為2,c只能為1,結果為1/2。與連續情況的0.75都有著很大的差別,因為此時這個單位長度佔了整體樣本範圍的一半以上。
如果題主要的是離散情況下對於任意n都成立的解析解,我覺著非常困難。但是要解個數值解還是木有什麼問題的。定義概率空間S為 {((a,b), (c,d) ) },找出所有滿足條件的點組成的事件A{((a, b), (c, d))滿足 a* b &> c *d 且 a &> c}問題在於對於空間S中任意一個點((a, b), (c, d))的概率應該是多少呢?如果能假設a, b, c, d是相互獨立的,且a, b, c, d在空間 {1~ 100}上的概率是均勻分布的;也許任意點((a, b),(c, d))在空間S上概率是 1/100的4次方。事件A中的點數乘以1/100的4次方即得結果。寫一個小程序就能找出滿足條件的A。:)
第一反應應該是朝條件概率的方向去算。
看z=xy在正交系裡用一個面截取的體積的大小作為基本概率值。
為了晚上還能睡覺,就寫到這吧。反正就是這麼個解題思路。推薦閱讀:
※從1~n里取K個數,這K個數之和的奇偶性的概率?
※如何舉例說明數學期望有時是不存在的?
※宿命是否存在?真的存在隨機事件嗎?
※量子通信迄今最通俗易懂的解釋在哪裡?
※為什麼隨機變數X和Y不相關卻不一定獨立?