一條長度為一的線段隨機分成五份,其中至少有一份>四分之一的幾率是多少?

數學問題,這道題有怎麼樣的解法呢?


首先回憶 x_1+x_2+ldots+x_n=c ,其中 x_iin mathbb{N^+},cinmathbb{N^+} ,這個方程有 c-1 choose n-1 個解。

那麼考慮 y_i=sum_{j=1}^i x_j ,那麼 y=(y_1,y_2,ldots,y_n)x=(x_1,x_2,ldots,x_n) 是一一映射的。而 y 的意義就是從 {1,2,....,c} 中從小到大選 n-1 個數(第 n 數是 c ), x的意義就是它們之間的距離。現在記這個為我們的整體樣本數數量。注意我們就假設這裡每個樣本對應的概率都是一樣的。這也很符合常識,每一個 y 的概率(假設均勻分布)是一樣的。

現在我們給每個 x_i 一個下界 b_iinmathbb{N}^+ ,即 x_igeq b_i ,那麼在這些限制下,原方程就只有 c-sum_{i=1}^n (b_i-1) -1 choose n-1 個解了。那麼對應的概率 P(land_{i=1}^nx_igeq b_i)=frac{c-sum_{i=1}^n(b_i-1)-1choose n-1}{c-1 choose n-1}這個概率可以被解釋為把c個點分成n個部分,同時滿足對所有 i都有 x_igeq b_i的概率.

現在我們來考慮連續情況,忽略嚴謹性,我們假設離散情況的極限收斂於連續情況。

考慮一條長度為1的線段,它被切成 n 份,那麼設對應長度(依次)為 chi_1,chi_2,ldots,chi_n,chi_iinmathbb{R}^+, 那麼對於一組下界 alpha=(alpha_1,alpha_2,ldots,alpha_n),alpha_iinmathbb{R}^+ ,我們想求P(land_{i=1}^n chi_igeqalpha_i)

利用離散時的結論,我們把這個長度為1的線段看成是 c 個點組成的點列( c 很大),那麼 x_i=[cchi_i ],b_i=[calpha_i] ,所以

P(land_{i=1}^n chi_igeqalpha_i)=limlimits_{c	o infty}P(land_{i=1}^n x_igeq b_i)=limlimits_{c	o infty}frac{c-sum_{i=1}^n([calpha_i]-1)-1choose n-1}{c-1 choose n-1}

我們這可以用Stirling"s approximation,注意 frac{sum_{i=1}^n[calpha_i]}{c}approx sum_{i=1}^nalpha_i=sleq 1 ,經過化簡

P(land_{i=1}^n chi_igeqalpha_i)=(1-s)^{n-1} 。(從這個答案來看,我這種方法可能稍微麻煩了一點,可以直接說從 (1-s) 中選 (n-1) 個點)。

Ok!剩下的事情就簡單了,現在題目中要我們切五份,求至少一份大於0.25的概率,數學上就是說

n=5,P(lor_{i=1}^{5}chi_i>0.25) 。根據容斥原理

P(lor_{i=1}^{5}chi_i>0.25)=sum_iP(chi_i>0.25)-sum_{i< j}P(chi_i>0.25landchi_j>0.25)+ldots

帶入之前的公式,答案就是

P(lor_{i=1}^{5}chi_i>0.25)={5choose 1}(1-0.25)^4-{5 choose 2}(1-0.5)^4 +{5choose 3}(1-0.75)^4=0.99609375

可以說是相當高了。

以防萬一,我用c++簡單驗證一下。

#include&
#include&
#include&
#include&
#include&
using namespace std;

double rand1() {
return rand() / (RAND_MAX + 1.);
}

int main() {
srand(time(NULL));
const int n = 5;
vector& slots(n-1);
const long long int times = 10000000;
long long int count = 0;
const double thread = 0.25;
for(long long int i=0; i&0.25) successQ = true;
for(int j=1; j&0.25) successQ = true;
}
if(1-slots[n-2]&>0.25) successQ = true;
if(successQ) count ++;
}
cout &<&< "success counts: " &<&< count &<&< " in " &<&< times &<&< " experiments" &<&< endl; cout &<&< "probability: " &<&< (double) count/times &<&< endl; return 0; }

結果:

跟理論值還是有點接近的。

又跑了個十億的玩玩

越來越接近理論值了,嗯吃雞去了。


在5維空間中0&

int _0^1dx_1int _0^1dx_2int _0^1dx_3int _0^1dx_4int _0^1dx_5delta (x_1+x_2+x_3+x_4+x_5-1)

其中δ(x)為狄拉克delta函數。用mathematica可以求出等於1/24:

Integrate[DiracDelta[x1 + x2 + x3 + x4 + x5 - 1], {x1, 0, 1}, {x2, 0, 1}, {x3, 0, 1}, {x4, 0, 1}, {x5, 0, 1}]

而5維空間中0&

int _0^{frac{1}{4}}dx_1int _0^{frac{1}{4}}dx_2int _0^{frac{1}{4}}dx_3int _0^{frac{1}{4}}dx_4int _0^{frac{1}{4}}dx_5delta (x_1+x_2+x_3+x_4+x_5-1)

用mathematica可以求出等於1/6144:

Integrate[DiracDelta[x1 + x2 + x3 + x4 + x5 - 1], {x1, 0, 1/4}, {x2, 0, 1/4}, {x3, 0, 1/4}, {x4, 0, 1/4}, {x5, 0, 1/4}]

因此分五分每一份都小於1/4的概率為:24/6144=1/256=0.00390625

而分五份至少有一份大於1/4的概率為:1-1/256=255/256=0.99609375

————————具體計算————————

計算中要利用Delta函數的積分性質:

intdelta(x-c)dx=	heta(x-c)

其中c為任意常數,θ(x)為海維賽德階躍函數。

還要用到階躍函數的積分性質:

int	heta(x-c)dx=(x-c)	heta(x-c)

int x	heta(x-c)dx=frac{1}{2}(x^2-c^2)	heta(x-c)

......

int x^n	heta(x-c)dx=frac{1}{n+1}(x^{n+1}-c^{n+1})	heta(x-c)

具體計算就是一層一層積分:

egin{align*} 	ext{I}=int _0^1dx_1int _0^1dx_2int _0^1dx_3int _0^1dx_4int _0^1dx_5delta (x_1+x_2+x_3+x_4+x_5-1)\ =int _0^1dx_1int _0^1dx_2int _0^1dx_3int _0^1dx_4	ext{I}_5 end{align*}

其中I5為:

egin{align*} 	ext{I}_5=int _0^1dx_5delta (x_1+x_2+x_3+x_4+x_5-1)\ =	heta(x_1+x_2+x_3+x_4+x_5-1)|_{x_5=0}^1\ =	heta(x_1+x_2+x_3+x_4)-	heta(x_1+x_2+x_3+x_4-1) end{align*}

帶入有:

egin{align*} 	ext{I}=int _0^1dx_1int _0^1dx_2int _0^1dx_3int _0^1dx_4	heta (x_1+x_2+x_3+x_4)\ -int _0^1dx_1int _0^1dx_2int _0^1dx_3int _0^1dx_4	heta (x_1+x_2+x_3+x_4-1)\ =1-int _0^1dx_1int _0^1dx_2int _0^1dx_3	ext{I}_4 end{align*}

其中第一行等號右邊的第一項積分顯然等於1,而I4為:

egin{align*} 	ext{I}_4=int _0^1dx_4	heta (x_1+x_2+x_3+x_4-1)\ =(x_1+x_2+x_3+x_4-1)	heta (x_1+x_2+x_3+x_4-1)|_{x_4=0}^1\ =(x_1+x_2+x_3)	heta (x_1+x_2+x_3)\ -(x_1+x_2+x_3-1)	heta (x_1+x_2+x_3-1) end{align*}

帶入有:

egin{align*} 	ext{I}=1-int _0^1dx_1int _0^1dx_2int _0^1dx_3(x_1+x_2+x_3)	heta (x_1+x_2+x_3)\ +int _0^1dx_1int _0^1dx_2int _0^1dx_3(x_1+x_2+x_3-1)	heta (x_1+x_2+x_3-1)\ =1-3int _0^1dx_1int _0^1dx_2int _0^1dx_3x_3-int _0^1dx_1int _0^1dx_2int _0^1dx_3	heta (x_1+x_2+x_3-1)\ +3int _0^1dx_1int _0^1dx_2int _0^1dx_3x_3	heta (x_1+x_2+x_3-1)\ =-frac{1}{2}-int _0^1dx_1int _0^1dx_2	ext{I}_{31}+3int _0^1dx_1int _0^1dx_2	ext{I}_{32} end{align*}

其中I31、I32分別為:

egin{align*} 	ext{I}_{31}=int _0^1dx_3	heta (x_1+x_2+x_3-1)\ =(x_1+x_2+x_3-1)	heta (x_1+x_2+x_3-1)|_{x_3=0}^1\ =(x_1+x_2)	heta (x_1+x_2)-(x_1+x_2-1)	heta (x_1+x_2-1) end{align*}

egin{align*} 	ext{I}_{32}=int _0^1dx_3x_3	heta (x_1+x_2+x_3-1)\ =frac{1}{2}left [ x_3^2-left ( 1-x_1-x_2 
ight )^2 
ight ]	heta (x_1+x_2+x_3-1)|_{x_3=0}^1\ =frac{1}{2}left [ 1-left ( 1-x_1-x_2 
ight )^2 
ight ]	heta (x_1+x_2)\ +frac{1}{2}left ( 1-x_1-x_2 
ight )^2 	heta (x_1+x_2-1) end{align*}

再帶入……

後面就不具體計算了,輸入公式太麻煩了。總之計算稍微有些繁瑣,但是只要熟悉了δ(x)函數和θ(x)的積分,每一步都是簡單的初等積分。


已經有了利用積分,很標準的解法。以下解法只需要用到排列組合的知識,提供一個新的思路。(因為在手機上,不會編輯公式,圖也很渣)

同樣,考慮所有線段長度都小於1/4的概率,那麼1減去這個概率就得到了答案。

這五個線段的長度,由切割線段的四個點的位置所決定。因此與其考慮五個線段,我們只考慮這四個點的位置。

為了簡化問題,可以將線段從左到右分成四個長度為1/4的分區。若任意兩個切割點在同一個分區,則必然有一個分區內沒有切割點,也就意味著某兩相鄰點之間距離大於1/4。因此每個分區都必須有1個切割點。

如圖所示,A,B,C,D是四個落在四個不同分區的四個點。而四個點落在不同分區的概率是:4!/4^4。

但是僅僅是這四個點落在不同分區的約束性還不夠強。比如說要想讓AB的長度小於1/4,那麼B到其所在分區的左端的距離,要小於A到其所在分區左端的距離。

為了可以視覺化這個問題,我們將四個分區並排擺列,然後將這四個點投影在一個長度為1/4的分區上。

因為投影重合的概率是0,在下面的答案中默認DCBA四點的投影沒有重合。

為了滿足兩點之間距離小於1/4,在投影上,A要在B右邊,B在C右邊,C在D右邊。這樣問題就被大大簡化。

那麼DCBA排列的可能性是多少呢?

假設同一個投影,交換切割點的名字,比如圖中的點A和B的位置,得到排列DCAB。

而A和B這個名字,代表了切割點所在的分區,因此交換名字A,B得到了不同的切割點位置。這樣DCAB並不滿足所有線段距離小於1/4。也就是說對於同一個投影,對應著的切割點排列的數量等於A,B,C,D這四個名字的排列數量=4!。而符合要求的排列只有DCBA這一種。

因此,所有線段都小於的概率是:

4!/4^4*1/4!=1/256。

因此至少有一個線段長度大於1/4的概率是255/256。


考慮幾何概型:

0leq x_1 leq frac{1}{4}

0leq x_2 leq frac{1}{4}

0leq x_3 leq frac{1}{4}

0leq x_4 leq frac{1}{4}

0leq x_5 = 1-x_1-x_2-x_3-x_4 leq frac{1}{4}Rightarrow frac{3}{4}leq x_1+x_2+x_3+x_4 leq 1

max{[0, frac{3}{4}-x_1-x_2-x_3]}leq x_4 leq min{[frac{1}{4}, 1-x_1-x_2-x_3]}

I_1 = int_0^frac{1}{4}dx_1 int_0^frac{1}{4}dx_2 int_0^frac{1}{4}dx_3int_{{max[0, frac{3}{4}-x_1-x_2-x_3}]}^{min{[frac{1}{4}, 1-x_1-x_2-x_3}]}dx_4 = int_0^frac{1}{4}dx_1 int_0^frac{1}{4}dx_2 int_0^frac{1}{4}dx_3 int _{frac{3}{4}-x_1-x_2-x_3}^{frac{1}{4}}dx_4

注意到需要 x_4 的積分下限需要小於上限,即 frac{1}{4} geq frac{3}{4}-x_1-x_2-x_3Rightarrow x_3 geq frac{2}{4}-x_1-x_2

同理 x_2 geq frac{1}{4} -x_1

實際上,I_1 = int_0^frac{1}{4}dx_1int_{frac{1}{4}-x_1}^frac{1}{4}dx_2int_{frac{2}{4}-x_1-x_2}^{frac{1}{4}}dx_3int_{frac{3}{4}-x_1-x_2-x_3}^{frac{1}{4}}dx_4 = frac{1}{6144}

x_i 的最大值放寬到 1

I_2 = int_0^1dx_1 int_0^{1-x_1}dx_2int_0^{1-x_1-x_2}dx_3int_0^{1-x_1-x_2-x_3}dx_4 = frac{1}{24}

P = 1-I_1/I_2 = 1 - 24/6144 = 1 - 1/256 = 255/256

n_success &<- 0 n_trial &<- 100000 for (i in 1:n_trial) { r &<- sort(runif(4)) x &<- c(r[1], diff(r), 1-r[4]); if (any(x &> 0.25)) {
n_success &<- n_success + 1; } } print(n_success / n_trial) [1] 0.99639

--------------------------------------------------------------------------------------

不知道對不對。。。

原回答 不嚴謹

x_1+x_2+x_3+x_4+x_5=1exists  i in {1,2,3,4,5}  	ext{s.t.}  x_i > frac{1}{4} 解題難處在於 x_i (i=1,2,3,..,5) 並不是獨立同分布。不妨反面考慮 x_1+x_2+x_3+x_4+x_5=1forall  i in {1,2,3,4,5}  	ext{s.t.}  x_i leq frac{1}{4}

考慮:

x_1 sim 	ext{Uniform} (0, frac{1}{4}]

x_2 sim 	ext{Uniform} (0, frac{1}{4}]

x_3 sim 	ext{Uniform} (0, frac{1}{4}]

x_4 sim 	ext{Uniform} (0, frac{1}{4}]

x_5 = 1-x_1-x_2-x_3-x_4

於是四維棱長為 frac{1}{4} 立方體除以棱長為 1 立方體就是

frac{(frac{1}{4})^4 	imes 1}{1}=frac{1}{(2^2)^4} = frac{1}{2^8}

所求概率就是 1 - frac{1}{2^8} = frac{255}{256}


看著答案猜解法(已知答案是1/256):

我們知道一個圓上隨機取3點,連成的三角形包含圓心的概率是1/4。做法是取每一點的對稱點,一共有2^3=8種取法,其中只有2種是包含圓心的,所以概率是1/8*2=1/4。易知三角形包含圓心==三段弧每一段長度不超過1/2。所以試圖用這個解法猜一下:

在一個圓上隨機取N個點,對每個點作將圓(N-1)等分的對稱點。假設在這些對稱點中隨機選取,那麼一共是(N-1)^N種取法。在這些取法中有且只有(N-1)種是使得每一段長度不超過1/(N-1)的【這個是猜的】。所以概率是1/(N-1)^(N-1)。代入3,得到1/(3-1)^(3-1)=1/4。代入5,得到1/(5-1)^(5-1)=1/256。可以推廣:任意取4個點,沒有一段線段長度長於1/3的概率是1/(4-1)^(4-1)=1/27,等等等

【猜的部分的證明】證明貌似也不難,把5*4=20個點畫在圓上(每4個點為一組把圓4等分),易知在任意1/4長的圓弧上有且僅有5個點。所以需要取的5個點的順序就是在這段圓弧上的點的順序。容易證明有且僅有這一種取法。根據對稱性,有4種等價的取法(每種就是轉1/4)。這個解法基本上和 @無知的耗子 的解法差不多。

作個圖(以圓上任意取4個點,沒有一段線段長於1/3為例):

  1. 隨便取4個點,假設是紅藍綠黃;

2. 作這四個點對圓3等分的對稱點。易知隨便取一段1/3長的弧,弧上有且僅有4個點;給這些點隨便編個號:

3. 所以將圓分成4份,並且沒有一段圓弧長於1/3的取法有且僅有3種:綠1紅3藍2黃1, 以及另外2種對稱的取法。

4. 因為一共可能的取法有3^4種,所以最後的概率就是3*(3^(-4))=1/27.


講個簡單可以推廣一些的方法吧

感覺很多答案沒說清楚,就是隨機分成五份的含義,不想深究的可以直接看後面部分的解答。

X_{0}=0,X_{5}=1 ,4個分位點記為 X_{1},X_{2},X_{3},X_{4}

Y_{i}=X_{i}-X_{i-1}

隨機分成五份這裡應該是理解為,Y_{1},Y_{2},Y_{3},Y_{4},Y_{5} 的聯合密度函數 f_{Y}(y_{1},y_{2},y_{3},y_{4},y_{5}) 在超平面 y_{1}+y_{2}+y_{3}+y_{4}+y_{5}=1 是個常數,

但是實際上這玩意是沒有正常的密度函數的,一種解決方法是用狄拉克測度,即

f_{Y}(y_{1},y_{2},y_{3},y_{4},y_{5})=delta(y_{1}+y_{2}+y_{3}+y_{4}+y_{5}=1)*constant

另一種理解可以認為 X_{1},X_{2},X_{3},X_{4} 是[0,1]上均勻分布的順序統計量。

當然這兩種理解是一樣的。其他理解應該也有,只不過我覺得這個事情還是要說清楚

解答:

要求長度為1的線段隨機分成n分,至少有一份大於a的概率。

根據容斥原理, P(exists Y_{i}>a)=sum_{k=1}^{n}(-1)^{k-1}C_{n}^{k}P(Y_{j}>a,j=1,...,k)

注意到 int_{0leq y_{i}leq k}delta(y_{1}+...+y_{n}=k)=k^{n-1}/(n-1)!

根據上面對隨機分法的討論,可知 Y_{1},...,Y_{n-1} 的在 y_{1},...,y_{n}上的密度

f_{Y}(y_{1},...y_{n})=(n-1)!delta(y_{1}+...+y_{n}=1) (0leq y_{i})

ak<1 時,

P(Y_{k}>a,k=1,...,i)=int_{y_{k}>a,k=1,...,i}f_{Y}(y_{1},...,y_{n})dy_{1}...dy_{n}

做換元 s_{k}=y_{k}-a

=int_{s_{k}>0,k=1,...,i}f_{Y}(s_{1}+a,...,s_{k}+a,y_{k+1},...,y_{n})ds_{1}...ds_{k},dy_{k+1},...dy_{n}

=int_{s_{k}>0,k=1,...,i}(n-1)!delta(s_{1}+...+y_{n}=1-ka)ds_{1}...ds_{k},dy_{k+1},...dy_{n}

=(1-ak)^{n-1}

所以 P(exists Y_{i}>a)=sum_{k=1}^{n}C_{n}^{k}(-1)^{k-1}(1-ak)_{+}^{n-1}

實際上從 @bus waiter 的結果很容易看出這個形式

最後結果自然就是0.99609375


我在想能不能用ordered probability解(好像是這個東西?)

具體思路如下

x1,x2,x3,x4為4個0到1區間上uniform的rv,y1,y2,y3,y4為從小到大的這4個值

所以可以構建ordered density=4!f(x1)f(x2)f(x3)f(x4)=24,也就是f(y1,y2,y3,y4),求出distribution,第一段長度為y1,第二段y2-y1,....最後一段1-y4

求出每段小於1/4的概率(分別要求y_(i+1)-y_i &<1/4)

然後1減去乘積就行

沒去算,不知道行不行,不過上面兩個方法沒毛病


微積分忘記是啥了,

概率學也基本不明白了,

那麼還是要給一個答案

這個問題是 1 - 5份都大於1/4 - 4份都大於1/4 - 3份都大於1/4 - 2份都大於1/4 - 0份都大於1/4 = 1份都大於1/4

得分吧?


切法不定怎麼確定概率呢?

比如說,一種定義的切法:每一刀切下去要比前一刀切下去的短(長);每兩刀切下去要求有兩段相同長度;第二刀切下去一定要切總長度刀四分之一

等等。

定義了切法才能定義概率


推薦閱讀:

人類行為服從的冪律分布是否違背了中心極限定理?
概率論問題:邏輯上說不通?
如足夠久,180萬隻猴子能不能敲出莎士比亞全集?
從第一個人開始,三個人輪流扔一個六面骰子,三個人率先扔出6的概率分別是多少?
為什麼麥克斯韋-玻爾茲曼速度分布在v=0時,兩種表述不一樣?

TAG:數學 | 微積分 | 高等數學 | 數學分析 | 概率論 |