指導人生演算法之最佳停時問題

前言

曾有一些學生找到蘇格拉底,問老師「人生是什麼呀?」蘇格拉底就把他們帶到一片蘋果林,要求大家從樹林的這一頭走到樹林的那一頭,每人挑選一隻最大最好的蘋果,但是不許走回頭路,不許選擇兩次。

當蘇格拉底在樹林的盡頭再看到這些學生的時候,好像他們每個人都不是很高興。有的學生說,我一進到果林就看到一個非常好的蘋果,於是把它摘了下來,可是沒想到後來又遇到了更好的蘋果。也有學生說,後面的蘋果沒有前面的好,我很後悔沒有拿前面的蘋果。蘇格拉底語重心長的說:「孩子們,這就是人生啊。人生就是一次無法重複的選擇。」

人生無法重複,沒有錯,但其實我們可以有最優解。這就是數學領域的最優停時的優化問題。如果你在前三分之一的路程上觀察各種蘋果的大小顏色。以這前1/3的蘋果為樣本,然後選擇後面的蘋果,你就有37%的概率得到最好的蘋果。這就是傳說中的37%法則。

最初的版本

我們以秘書問題做為這個法則介紹的起點。

想像你在面試一秘書,你希望能在應聘者里找到最好的人,但你並不知道怎樣的人會來應聘,所以你一個個人輪流面試。你可以隨時發offer,但你如果在面試後沒有馬上給對方offer,他就從此離開去其他地方工作了。你怎麼才能知道眼前這個應聘者是最好的呢?

方法就是給自己設定一個招聘總時間,前37%的時間裡只面試,收集數據不做決定,之後只要碰到一個比之前所有應聘者都優秀的人,馬上下offer,你能得到最好應聘者的機率也是37%。這是你能獲得的最好效果。

不要覺得37%成功率是個很低的數字。這個演算法可適用於任何大樣本。如果你有100個應聘者,你能獲得最好僱員的機率其實只有1%;而如果你有100萬應聘者,你的機率只剩百萬分之一。37%已經是一個非常好的數字了。為了達到這個成功率,你也需要付出之前37%的數據搜索時間精力。

改進

是不是只要牢記37%就一定可以取得成功呢?事實並非如此。

從前有一個聰明優秀的數學博士生在尋找女朋友,他發現這其實是一個「秘書問題」。於是他開始計算:假設從18歲到40歲都是找對象時間,37%時間點是26.1歲,而他正好在這個年齡點!他於是找到一位無論各方面他都覺得超出以往對象的姑娘,毫不猶豫地向她求婚。然而,他被拒絕了。

數學博士為愛悲傷之後,開始重新研究「秘書演算法」。他發現,女朋友比買東西複雜多了,原演算法有一個巨大假設:你發出的offer肯定會被對方接受。而即使在我們加州灣區,買房一般也是價高者得,還有中介幫忙估價,只要志在必得,總能做出讓對方接受的選擇,模型差別並不大。但是女孩子啊,君心深似海。

數學博士於是修正了演算法,他發現如果修正下前提,把對方接受概率改為50%,那麼你只有25%時間收集數據,而成功率也從37%降為25%。然而最不幸的是:我們這位博士已經超越25%數據收集時間了。

在我們的「經典秘書問題」中存在這兩個假設:首先面試官對候選人完全沒有任何了解,只能已經面試過的候選人作為樣本進行比較。所以我們才必須設置一個觀望期,來收集信息。

然而現實中我們是找秘書找房子還是找人生伴侶,大多數可以選擇的標準還是可以量化的。比如說像GRE等標準化考試,除了絕對分數之外,還可能會有百分比作為橫向比較標準。你不在數學部分,如果你獲得了滿分170分,那麼你就超過了97%的考生。在這種情況下,如果候選人是隨機樣本。那麼,傳統方法中的觀望期就可以被省略了。取而代之的方法是某一候選人。再超過某一百分比之後,就進行錄取。因此,在這種新的解法中。如果候選人非常多,可以適當提高標準。反正如果候選人比較少,就只能降低一些標準。

這個演算法的數學方法是這樣的,如果你只剩下了一位候選人,那麼毫無疑問,你只能選擇他。如果你上去了。兩位候選人,那麼你要判斷第二位候選人的分數百分比是否優於50%整體候選人。類似的邏輯,導數第四位錄取百分比為69%,倒數第四位為78%。隨著剩餘候選人的增多,選擇的標準也相應提升。最後一名候選人,錄取的百分比為95%。

也就是說最後一名候選人優於前面95%的候選人的時候,你才應該給他offer。這種策略選到最佳候選人的概率是58%。

傳統秘書問題的第二個假設,是你只有單項的一次選擇機會。然而事實真的是這樣嗎?

且讓我們看看著名天文學家開普勒如何處理這個找對象問題。1611年,開普勒妻子去世,他開始認真尋找再婚對象。在熱心紅娘們的幫助下,他最終確立了11個姑娘,逐一開始約會。但他約會到第四位姑娘時,他感覺找對人了,「我其實可以停止尋找了。」

然而開普勒是一個騎驢找馬的渣男。他並沒有停止尋找,而是吊著四姑娘,繼續按順序與剩下7個姑娘逐一約會。他最終發現第五個姑娘更好,「我喜歡她的愛、忠誠、家世、勤勞,和她給繼子們的愛。」他拋棄其他姑娘,向五姑娘求婚,餘生婚姻幸福美滿。

開普勒在「秘書問題」中,超越了演算法限制,頂著渣男的名聲,採用了「不拋棄不放棄」的策略。在姑娘們依然願意等待的演算法前提下,閱盡千帆了解了所有數據再做選擇,這當然是一種最佳策略。

假設可以重新去找你曾經錯過的姑娘,而女生有50%機率不計前嫌重修舊好,應該什麼時候開始做選擇呢?最佳停時演算法告訴我們:你可以花61%的時間搜集數據,然後在前61%的最佳選擇與之後每次碰到的最佳選擇中選最優選,你得到最佳伴侶的機率——也是61%。

結尾

說了這麼多,然而現實是蒼白的。

這個演算法本身並不能足夠精確的刻畫現實世界。人生路上,早早的摘下蘋果的也大有人在(難怪錢老會寫《圍城》)。每一次選擇都有機會成本,每一次付出都要考慮沉沒成本。歲月是把殺豬刀,誰能抵過時間呢?此情可待成追憶,只是當時已惘然。人生若只如初見,何事秋風悲畫扇。

不過,這些演算法還是為我們提供了一個新的角度,來幫助我們認識世界和我們自己。

參考資料

《algorithms to live by》

演算法和重大人生抉擇:如何最科學的選擇人生伴侶?MP3_IT科技新聞免費下載-喜馬拉雅FM

guokr.com/post/794746/


推薦閱讀:

九章演算法 | Google、Airbnb、Facebook面試題 : 外星人的字典(Alien Dictionary)
九章演算法 | Google 面試題:非下降數組
從上到下列印二叉樹
機器學慣用於金融市場預測難在哪?
AI小編問世!阿里智能寫手核心技術首次公開!

TAG:最優化 | 演算法 |