人類正在用科技來解決愛情,我記錄了其中兩個故事 | 演算法密碼

撰文 / 葉偉民

編輯 / 黃永明

*此文為科學新媒體「知識分子」(ID:The-Intellectual)發起的科學新聞實驗室寫作項目之「演算法密碼」第4篇。

大學時,我有兩個很要好的計算機系朋友。我們常常在周五晚上結伴去英語角。

這是一個充滿社交默契的地方,人們先三五成群地聊,再過渡到一對一交流,男女搭配是最理想的局面。但事實是,現場總不乏尷尬收場或不歡而散的狀況。

老K是我們仨中唯一修過博弈論的。他告訴我們,這事關一個穩定配對的演算法——「蓋爾—沙普利演算法」[1]。如果我們三個男生要在現場和三個女生實現一一匹配,最幸運的情況是每個男生「各」選其一,最糟糕的是每個男生「都」選其一。

絕大多數情況是,三位女生的邀請者數量分別為2、1、0。老K是這樣用「蓋爾-沙普利演算法」來解決配對的——收到2名男生(A和B)邀請的女生(1)選其一(如B),收到1名男生(C)邀請的女生(3)暫時接受,被拒絕的A轉而向其第二人選發出邀請,如選女生(2),問題解決;如選女生(3),則再重複開始的流程,直至女生沒有收到新的邀請為止。

最後一位接到邀請的女生可能略有不快,但這的確是最優的結果了。「蓋爾—沙普利演算法」最直觀的應用就是高校招生。考生志願和學校錄取標準的最終匹配,相當部分要歸功於它。其發明者也獲得2012年諾貝爾經濟學獎。

雖然在經濟領域大放異彩,「蓋爾—沙普利演算法」的起點卻是愛情。源自兩位數學家關於「穩定婚姻問題」的爭論,它因此也被稱為「求婚演算法」。

在數學家介入前,思索愛情主要是哲學家和文學家的任務。它在李清照凄婉的詩詞中,在羅密歐與朱麗葉相遇的四天里,在梁山伯與祝英台的墳前,也在泰坦尼克號沉入深海的前夜。

泰坦尼克號沉入深海的前夜

人類數千年的謳歌為愛情樹立了精神上的傳奇,卻無法改變現實中婚姻制度的式微。在美國,16歲以上人口的單身比例超50%[2],這既有生活方式和婚姻觀念演變的因素,也有社交變異的因素。

科技力量正嘗試解決這道超級難題。大數據和演算法正取代丘比特之箭,神秘浪漫的情感變得如公式般可計量預測。昔日妙不可言的「緣」,也正被準確製造於一座座永不停息的「愛情工廠」。

愛情這道數學題

五年前,洛杉磯的麥克金雷和北京的阿雲都是孤獨的人。前者35歲,是加州大學的數學博士,常年待在實驗室。23歲的阿雲剛離開故鄉安徽,孤懸異地,是一名網站編輯。

他們都用OkCupid,一款基於演算法的相親網站。

在婚戀市場上,麥克金雷是個十足的失敗者,身材幹瘦、頭髮稀少,相親網站的收件箱永遠是空的。阿雲對婚姻倒沒有那麼著急,她剛迷上攀岩,若能找到一個願意和她懸在峭壁上看藍天的伴兒,也是不錯。

OkCupid誕生於2004年,創始人是四名哈佛大學數學專業的學生,他們認為一個人能否找到靈魂伴侶,不是宿命,而是數學題。

他們的方法是這樣的:讓會員們回答15道必答題和若干附加題(最多可以達數百道),內容涵蓋政治、宗教、寵物、酒量、債務甚至戰爭觀。比如「宗教/上帝在你的生活中有多重要」,「嫉妒是不是一種健康關係」等。

這些問題不僅需要自己回答,還要為未來伴侶回答,即你希望對方在同一問題上持什麼看法,最後還要為這個問題選擇「重要度」(從「完全不重要」到「必不可少」共5檔,分別對應不同的分數)。

回答的問題越多,用戶畫像就越清晰。最終OkCupid的演算法會自動測算兩個會員間的匹配值,100%就是數學意義上的「靈魂伴侶」。

數學博士麥克金雷卻栽在了這道「數學題」上,他的答案如「怪咖」般不受歡迎。在有近10萬名女性使用OkCupid的洛杉磯,他的匹配結果很可悲。系統為他推薦了數十個「般配」的女性,麥克金雷非常認真地給她們發了自我介紹,但毫無迴音。

在北京的阿雲,因為是女生,而且很陽光健康,收到的搭訕會多一些,其中一位顯示與她匹配度還高達94%。她很高興,決定回應。對方是個外國人,雖然阿雲並不守舊,但沒聊幾句還是把她嚇著了——對方提出玩「Cyber Sex」(網路性愛)。

「這是我最討厭的類型。」阿雲感到被冒犯,「但機器卻看好我們。」

演算法里的「緣分」

人造緣分

人類之愛如神話一般古老,兼具至高的浪漫主義色彩、犧牲精神和穿越時間的永恆之義。甚至宗教諸神,「愛神」也有一席——東方為「月老」,西方則是「維納斯」。

愛情的本質在「不可知論」中徘徊千年後,現代科學也參與探尋,並誕生了「愛情物質」等理論,即認為愛情是苯基乙胺、多巴胺、去甲腎上腺素等化學物質綜合作用的結果。

然而,如何讓這種反應發生,也就是讓玄而又玄的「緣分」降臨,則是概率學的範疇了,這是數學家的領地。2010年,英國數學家彼得·巴克斯按照自己的擇偶標準,用「費米估演算法」[3]估算出全世界願意與他交往的女人數量是——26個,與科學家估算的銀河系智慧文明的數量(約一萬個)相比都少得可憐。

既然自然發生率如此低微,一些聰明的腦袋就著手研究「人造緣分」。早在1963年,兩名哈佛大學學生就想到了用計算機幫忙。他們設計了75個問題讓調查對象回答,並用一台IBM1401電腦計算出每個人的「最合適」的約會對象。它還有商業模式:拿到對方的聯繫方式前,每個人需繳納三美元。

這就是OkCupid等演算法相親應用的雛形。到麥克金雷開始使用的2012年,它已成為全美最受歡迎的約會網站之一,號稱每天撮合初次約會近三萬次。

這些數字越熱鬧,麥克金雷就越沮喪。現實中,他才華橫溢且經歷非凡。9·11發生時,他是世貿中心北塔91層一家公司的職員,只因每天下午兩點上班而躲過浩劫。他後來又加入麻省理工以高智商著稱的「黑傑克團隊」,利用速算能力和團隊配合縱橫賭場。

一個夏天的凌晨,寫著代碼的他突然意識到,他一直以己之短搏他人之長,雖不擅搭訕,但擅計算,他就應該像數學家一樣去相親。

「既然任何事情都有最優策略,約會也不例外。」麥克金雷說。

這位數學博士先註冊了12個OkCupid賬號,並通過一個Python腳本來控制它們。這些賬號會自動尋找他的目標(25歲到45歲之間的異性戀和雙性戀女性),並抓取她們的公開信息和回答過的問題。

然而,只收集了1000個賬號資料後,麥克金雷的賬號就接連被封了。OkCupid有防濫用系統,以防止此類數據收割。麥克金雷又編寫了一個程序,讓這些賬號能模擬真人點擊滑鼠和敲打鍵盤。這一次他成功騙過系統。

三個星期後,麥克金雷收集了符合其初選條件的兩萬個姑娘,600萬個問題及其答案。

人變成了齒輪

當麥克金雷在他的數據斬獲前興奮不已時,阿雲仍為上一次不愉快的配對耿耿於懷,她後來成為一名科技記者,對相親網站背後的演算法問題有了更發自職業的關注。

全球在線約會產業從1990年代中期起步,創辦於1995年的Match是最早的試水者。現在,全球在線約會產值已達30億美元。最大的付費市場在美國,中國的產業規模增長最快,用戶數已超2億人。[4]

技術對人類情感的滲透從未停止。早期,約會平台的模式相對原始,大多基於搜索和標籤篩選。爾後,LBS(基於地理位置服務)技術被納入應用。進入移動互聯時代後,演算法匹配又漸成主流。

用演算法作為婚介驅動,OkCupid不是唯一,類似的還有eHarmony,它出現於更早的2000年。過去17年間,不同演算法基礎的相親網站都來爭奪市場,還演化出基因匹配、面部識別匹配等看似更酷的玩法。

一款名為「奇緣」的移動應用則走中間路線,保留了邂逅之美。它分析每個人的性格、偏好及社交圖譜,當「合適」的匹配對象出現在有效範圍內,雙方的手機就會發出警報,並通過藍牙交換信息。

阿雲發現了OkCupid還有個博客,內容為用大數據指導人們約會。例如「第一次約會應該提什麼問題?」OkCupid的建議是,可以「彎彎繞」地聊一些外圍話題,例如「啤酒的味道」——計算顯示,喜歡啤酒的人有60%或以上概率擁有更開放的性觀念。

隨後的一次線下約會,阿雲就發現被「套路」了。OkCupid推薦的是一位美國波特蘭的男生,經歷非常豐富,是個有意思的怪咖。但那些帶有性暗示的試探讓阿雲很不舒服。

「在這個應用里,我感覺人變成了齒輪,微妙的東西變得非常直白。」阿雲說,「生命的樂趣在於對未知的好奇,在於生命里的偶遇和驚喜。而這些,我不覺得OkCupid能明白。」

麥克金雷沒有這種東方式的浪漫,他仍寄望於他的數學實驗。現在,他要從搜集來的兩萬名女性的600萬個問題及答案中尋找某種規律,不斷縮小選擇範圍。他開始嘗試不同的演算法,當他找到貝爾實驗室的「K-Modes演算法」時,覺得正是所需。

這個演算法最初用作黃豆災害的原因分析,能夠根據數據特徵,將研究對象細分為不同類型。他認為人群分類也應同理。果然,兩萬名異性被分為了七組。這在麥克金雷看來是關鍵的一步,他為此欣喜若狂。

麥克金雷繼續做減法,例如將年齡過大或宗教觀不太相符的組別排除,最後剩餘兩組。一組是25歲左右的女性,大多為音樂家和藝術家(A組);另一組年紀稍大,大多從事編輯或設計師等創造性職業(B組)。他決定都試一試。

此時,演算法已經幫他提煉出兩個類別里最受歡迎的500個問題。基於對未來婚姻的忠誠原則,他如實回答了這些問題,但讓機器幫助他選擇重要程度,以提高匹配分數。

他還耍了一點小心思,例如介紹里自稱是「數學教授」。較年輕的A組,他用攀岩的照片做頭像,B組則是彈吉他的文藝照。最後,他讓電腦程序去自動訪問這兩組女性的賬號,對方根據系統提醒就會看到他。

很快,一個前所未有的局面發生在這個情場失敗者的面前。他主頁的回訪量激增,最多時一天能有400人,他的收件箱也湧入很多問候。

「我從來沒有見過跟我匹配度這麼高的人。」一位女士寫道,「我感覺你應該有些故事……」另一個則毫不掩飾地稱讚麥克金雷的吸引力:「我想我們會有很多共同點,雖然數學上不是,但其他方面像得驚人。」

「是我找到了你」

麥克金雷終於可以離開實驗室。他先到大學體育館痛痛快快地洗了澡,然後去見這些問候者。他的策略是兩組女士交叉見面。

第一位是A組一位具有藝術家氣質的設計師,他們共進午餐,禮貌有加,但雙方都沒動心。第二天他見B組的一位博客寫手,可是對方消極陰鬱的氣質讓他很難提起興趣。到第20次約會時,他發現A組很多人都有紋身,或養中大型犬,他均不能接受。於是,他停止了和A組的約會,專心B組。

但情況很糟糕。一直到約會了55人,願意見第二面的人才有3個,見第三次面的才1個。麥克金雷感覺很不好,開始懷疑自己的演算法,更開始懷疑人生。

遠在北京的阿雲也有了變化。她將剩餘的耐心給了OkCupid上的幾個邀約,還真找到了一個男朋友。一開始阿雲感覺不錯,慢慢卻發現對方患有抑鬱症。相互痛苦了一段時間後,他們還是分開了。

而且她還發現一個更隱蔽的問題,身邊用此類約會軟體的朋友都變得玩世不恭。「愛情變得容易了,人們有了問題不是去解決,而是換下一個。」阿雲說,「那種感覺好像是:反正池塘里還有這麼多魚,再撈就是。」

阿雲不想再陷在這個被演算法操控的遊戲里了。她決定註銷OkCupid賬號,永久地。

麥克金雷也幾乎要放棄了,他已經約會了87次,仍一無所獲。他覺得一切計算手段,在雨果所說的「比天空更弘大」的人類內心面前,如投入深海的細沙,毫無波瀾。

然而,一個叫克莉絲汀的亞裔姑娘這時出現了。她發來問候信,說正在加州大學讀藝術,希望能找到一個身高180cm左右、長著藍眼睛的傢伙。最後,OkCupid給她推薦了麥克金雷,匹配度91%。

到了見面的時間,當麥克金雷走進雙方約好的壽司店,見到克莉絲汀,一種前所未有的電光火石般的感覺在心中迸裂。他們從書籍談到了音樂,麥克金雷還把他的「愛情演算法」和盤托出。

「這事兒確實有些神經質。」克莉絲汀說,「不過我喜歡。」

麥克金雷用「演算法」結束了單身狗生活

阿雲的另一段故事也開始了。她越來越愛攀岩,也越來越討厭大城市。2015年,她辭職去了大理,後經朋友介紹,遇到了來自加拿大的攀岩嚮導德恩。德恩當時很窮,衣服上都是破洞,但他很善良,會毫不猶豫地幫街邊小販撿散落的東西。

像麥克金雷的壽司店奇遇那樣,阿雲也被一種毫無因由的觸電感俘獲。他們相愛了,在此後的一年多時間裡,他們開著德恩爺爺留下的老爺車,穿越北美,白天攀岩,晚上睡車裡,沒錢時還要撿超市的過期食品。

「相比我身邊的網上情緣,我們會更珍惜彼此。」阿雲說,「因為它來得更真實,更強烈,無法像一個虛擬賬號那樣輕易刪除。」

麥克金雷和阿雲只是數億網路相親人群的縮影。技術和人類情感的關係也進入人文學者的研究列表。雖然互聯網婚介已成為一門全球好生意,但學者們的主流觀點認為,不必擔心愛情像芭比娃娃那樣被複制。

「計算機不可能有感情。」麻省理工學院精神分析學家雪莉·特克爾在她的《群體性孤獨》一書中說,「我們只有設身處地為對方考慮,通過生老病死、婚喪嫁娶等相同的人類體驗建立彼此間的聯繫,我們的感情才具有真實性。」

在一次媒體採訪中,麥克金雷和克莉絲汀也就這個問題爭論過。麥克金雷仍為他的演算法沾沾自喜,克莉絲汀卻不同意,她認為演算法只是他們故事的前傳,真正的挑戰是從相遇之後開始。

「你沒有找到我,是我找到了你。」克莉絲汀敲著男友的手肘說。麥克金雷思考良久,最終承認她是對的。

注釋

[1] 蓋爾-沙普利演算法,數學家蓋爾和沙普利為了尋找一個穩定匹配而設計出的市場機制。該演算法的一個關鍵之處在於,合意的要約不會立即被接受,而是「延遲接受」,直至沒有新的要約發出為止,最終達到相對最優最穩定的結果。

[2] 據2014年9月《青年參考》報道。

[3] 費米估演算法,也稱「費米問題」,即在科學研究中用來做量綱分析、估算和清晰地驗證一個假設的估算問題。著名案例如估算芝加哥鋼琴調音師的數量,通過分解城市總人口、擁有鋼琴家庭比例、調音頻次等元素,一步步推導出近似結果。

[4] 數據綜合自美國在線統計數據門戶Statista及中國市場諮詢機構艾瑞。

譯名對照表

麥克金雷 Chris·McKinlay

彼得·巴克斯 Peter·Backus

克莉絲汀 Christine Tien Wang

雪莉·特克爾 Sherry·Turkle

——————————

?? 歡迎關注公號「葉偉民寫作內參(ID:yeweimin121)」;

另有知乎Live課程【如何寫出你的超級故事】,7節Live打造寫作特訓營;

知乎電子書【從零開始寫故事:一個南方周末記者的特稿筆記】也已全新上線。

推薦閱讀:

如何判斷一個 16 位乃至更高位的整數是否為一個素數?
如何將平面上無序的一組點連成一個簡單多邊形?
九章演算法
100 個數,如何遍歷得到所有全排列?

TAG:算法 | 爱情 | 相亲 |