標籤:

一道突然想到的概率題,如何解決?

設x=a*b,y=c*d,a、b、c、d的範圍都是1-100的隨機數字,如果已知a>c,則x>y的概率是多少?如果a、b、c、d都是1-n(n為任意固定的自然數且大於2)的隨機數字,概率又是多少?(a、b、c、d都是某個範圍隨機的數字)


離散情況很不好做,因為a>c這樣的條件會在概率空間中划出一道參差不齊的邊緣。

不過n足夠大的時候,可以用下面的連續情況來近似。

連續情況:設a,b,c,d獨立,且均服從[0,1]上的均勻分布,求條件概率P(ab>cd,|,a>c)

u=c/a,由上圖易知u的累積概率函數為:

F_u(x) = P(u le x) = left{ egin{array}{ll}
0,  (x le 0) \
x/2,  (0 < x le 1) \
1 - 1/(2x),  (x > 1)<br />
end{array}<br />
ight.

其概率密度函數為:

p_u(x) = frac{partial F_u(x)}{partial x} = left{ egin{array}{ll}
0,  (x le 0) \
1/2,  (0 < x le 1) \
1/(2x^2),  (x > 1)<br />
end{array}<br />
ight.

同樣設v=b/d,則v的分布跟u相同且獨立。

所求條件概率為

  P(v>u ,|, u<1) \
= frac{P(v>u, u<1)}{P(u<1)} \
= frac{int_0^1 p_u(x) P(v>x) ,	ext{d}x}{1/2} \<br />
= 2 int_0^1 frac{1}{2} left( 1-x/2<br />
ight) ,	ext{d}x \<br />
= frac{3}{4}


離散的情況極限還是3/4的.

mathbb{P}=frac{sum_{a=2}^nsum_{c=1}^{a-1}sum_{b=1}^nminleft(left(left lceil frac{ab}{c} 
ight 
ceil-1
ight),n
ight)}{n^2inom{n}{2}}

=frac{sum_{a=2}^nsum_{c=1}^{a-1}left{sum_{b=1}^{cn/a}frac{ab}{c}+sum_{b=cn/a+1}^n n
ight}+O(n^3)}{n^2inom{n}{2}}

=frac{left(frac{3}{4}n^2+frac{n}{2}
ight)inom{n}{2}+O(n^3)}{n^2inom{n}{2}}

=frac{3}{4}+Oleft(frac{1}{n}
ight).


@王贇 Maigo給出了連續情況的答案,但是我想出了一個更簡單巧妙的方法。

P(ab&>cd | a&>c)=P(ab&>cd 且 b&>d | a&>c)+P(ab&>cd 且 b&<=d | a&>c)

注意到

P(ab&>cd 且 b&>d | a&>c)=P(b&>d | a&>c)=P(b&>d)=1/2

第一個等號是 a&>c b&>d 則必然ab&>cd, 第二個等號是a,b,c,d的獨立性

P(ab&>cd 且 b&<=d | a&>c)=P(ab&>cd | a&>c,b&<=d)×P( b&<=d)=1/2 * 1/2 =1/4

第一個等式是貝耶斯加a,b,c,d的獨立性,第二個等式是對稱性

所以答案就是1/2+1/4=3/4


P_n=frac{(n+1)(3n-2)}{4n^2}

利用對稱性算出來的

x&>y與x&y的組合數目為frac{n^4-N_{x=y}}{2}

同理可以求得a&>b的組合數目,以及x&>y且a&>b的組合數目

根據條件概率P(x>y|a>c)=frac{N_{x>y,a>c}}{N_{a>c}}即可求得

不過計算步驟略複雜,只是提供一個思路

--------------------------------------------------------

根據集合性質P(Acup B)=P(A)+P(B)-P(Acap B)

N_{x=y}=N_{a=c,b=d}+N_{a=d,b=c}-N_{a=b=c=d}=2n^2-n

同樣的,N_{a>c}=frac{n^3(n-1)}{2}

對於N_{x>y,a>c}情況比較複雜,考慮x&>y的時候,a,b,c,d有以下幾種情況

(a&d)

(a=c,b&>d)

(a&>c,b&c,b=d),(a&>c,b&>d)

根據對稱性可知

N_{a<c,b>d}=N_{a>c,b<d}

N_{a=c,b>d}=N_{a>c,b=d}=frac{n^2(n-1)}{2}

剩下一種情況的數目也比較好求

N_{a>c,b>d}=(frac{n(n-1)}{2})^2=frac{n^2(n-1)^2}{4}

再往後就是多項式運算了

N_{x>y,a>c}=N_{x>y}-N_{x>y,a<c}-N_{x>y,a=c}


x=0.0
y=0.0
n=100
for c in range(1,n):
for a in range(c+1,n+1):
for b in range(1,n+1):
for d in range(1,n+1):
x+=1
if a*b&>c*d:
y+=1
print x,y
print y/x

跑一次連五分鐘都不到……

x是取值的可能情況總數,其實就是99*100/2*100*100

y是記錄ab&>cd的情況

(99*100/2是a,c可能取值的總數)

以下是輸出結果:

49500000.0 37238210.0
0.752287070707

根據需要修改n=2,3,4,5,6.....

n=3時取得最大值,為0.777778

同時根據 @王贇 Maigo、 @王芊和 @德然 的回答,此概率會隨著n變大貼近於0.75.


離散情況確實如 @王贇 Maigo所言不太好算。

但是不好算我們就不弄了嗎?不不不我們的態度還是要認真一點的。

但是不好算那要怎麼算呢?於是我就用了當初科學家們用過的最笨的辦法,我們就來做一遍數一數x&>y出現的次數不就好了(*/ω\*)

嗯下圖是不到8000次的結果,接近於0.75。離散情況與 @王贇 Maigo@王芊@德然 連續情況的計算結果相近

先挖個坑,電腦還在跑。更新中...

-----------------------------------------------------------------第一次更新分割線-------------------------------------------------

嗯現在是跑了8*10^4次。然而結果略有點出乎我的意料,先上圖

仔細看的話發現距離0.75的偏差還是較大的;檢查了一下數值結果,發現基本穩定在0.754左右。

具體原因我動筆算一算離散情況的理論結果,請等待下次更新的到來O(∩_∩)O謝謝!

--------------------------------------------第二次更新------------------------------------------------------------------------------

所以看來第一個辦法太傻了。用matlab直接遍歷了一遍所有可能,理論結果應當是0.7523。

第一個程序跑到16*10^4左右了,結果也逼近了理論結果

當前結果為0.7527。不想跑了。。。本本渣渣開始發熱了w(?Д?)w

理論上而言離散結果肯定是要比連續結果來得大的。因為在離散情況當中所謂的a&>c實際上應該為a&>=c+1;而連續情況中a&>c的計算結果與a&>=c的結果是相同的。所以這是整整相差了1個單位的長度。當n取更大的時候(例如n取100000000),由於1相對於n而言小了很多,結果也就越接近於連續情況。

相反,當n取得越小,這個單位長度的影響也就越大。n=3時為7/9,n=2時更容易計算,因為a只能為2,c只能為1,結果為1/2。與連續情況的0.75都有著很大的差別,因為此時這個單位長度佔了整體樣本範圍的一半以上。

如果題主要的是離散情況下對於任意n都成立的解析解,我覺著非常困難。但是要解個數值解還是木有什麼問題的。


定義概率空間S為 {((a,b), (c,d) ) },

找出所有滿足條件的點組成的事件A{((a, b), (c, d))滿足 a* b &> c *d 且 a &> c}

問題在於對於空間S中任意一個點((a, b), (c, d))的概率應該是多少呢?如果能假設a, b, c, d是相互獨立的,且a, b, c, d在空間 {1~ 100}上的概率是均勻分布的;也許任意點((a, b),(c, d))在空間S上概率是 1/100的4次方。

事件A中的點數乘以1/100的4次方即得結果。寫一個小程序就能找出滿足條件的A。:)


第一反應應該是朝條件概率的方向去算。

看z=xy在正交系裡用一個面截取的體積的大小作為基本概率值。

為了晚上還能睡覺,就寫到這吧。反正就是這麼個解題思路。


推薦閱讀:

從1~n里取K個數,這K個數之和的奇偶性的概率?
如何舉例說明數學期望有時是不存在的?
宿命是否存在?真的存在隨機事件嗎?
量子通信迄今最通俗易懂的解釋在哪裡?
為什麼隨機變數X和Y不相關卻不一定獨立?

TAG:數學 | 概率 |