標籤:

移民李飛飛|

來源:騰訊深網 作者:略大參考

「AI沒有國界,AI的福祉也沒有國界」,在12月中旬上海的一個演講中,李飛飛這樣說。

她自己就是那個技術和知識沒有國界最好的證明——出生於中國,16歲和父母移民到美國,全家人靠洗盤子、開乾洗店生存下來,憑藉強大的驅動力,她在普林斯頓、加州理工這些學校里完成了世界最好的科學訓練。

之後,她一頭扎進了人工智慧的研究中。

整個人工智慧研究領域,尤其是計算機視覺研究,因為她的貢獻而變得不同。2016年,美國最古老的基金會——卡內基基金會,提名她為當年的傑出移民。

但她在學科上做的貢獻、她培養的門徒從來沒有限制在美國境內。現在,她又作為谷歌的一員回到中國,領導這家公司在中國的人工智慧研究中心。

知識和技術總是流動的,不會因為行政命令或者是特朗普簽證關卡而停止流動。

1

李飛飛談及自己的人生,總是從16歲談起,她說那年她和父母移民到了美國。

她1976年出生在北京,16歲那年是1992年。

那大概是中美經濟生活之間還存在巨大差距的最後一個時代,從中國移民到美國往往要付出巨大的代價。李飛飛全家移民到美國兩年後,一部名為《北京人在紐約》的電視劇在國內爆紅,描寫的就是這種代價——社會地位的落差,經濟上的困頓等等。

李飛飛受過高等教育的父母來到美國後,也失去了原本在中國的知識分子的工作,父親給人修理照相機,母親則是一名收銀員。

用她自己話來說,全家人出於一種「求生模式」中。李飛飛說,她什麼樣的工作都做過,從在中餐館裡打工,到給人打掃房子甚至幫人遛狗,但她沒有覺得困難,因為父母也同樣努力工作。

初到美國,全家人住在紐約附近一個叫帕西帕尼(Parsippany)的地方,全家人僅有的一些朋友都是和他們一樣的移民,「大家都很忙,忙著討生活」。

作為一個移民,她必須從零開始學英語。相比當地的孩子,她渾身散發著書獃子氣,她說她在學校也沒有太多的朋友。

「我想要理解很多本質的問題,如宇宙的起源,生命的意義等,我想要生命中擁有那種智慧」,她說這是她的驅動力。

所幸她的數學和理科都不錯,她就讀的帕西帕尼高中(Parsippany High School)在新澤西州的高中里排名中等,她畢業的時候排名第六。

當時她申請了一大批學校,但普林斯頓給了幾乎全獎的獎學金,她去了普林斯頓。

事實上,她考上普林斯頓就在當地讓人驚訝了,1995年2月,當地的報紙專門刊載了她的故事,《「美國夢」成真了!》

她最大的欣喜是發現身邊朋友起了變化,「身邊全是這些學術、知性、充滿魅力的人」,她說。

她極少公開提及的是她與《南京大屠殺》的作者張純如在那段時間成了好友。她在普林斯頓讀書時,曾經舉行過一個跟南京大屠殺有關的活動,當時在地區有不小的影響力,作為學校里數量非常非常少的來自中國大陸的學生,做到這一點並不容易。

在她與知識分子為伍時,她家人的生活還在掙扎當中,她決定在帕西帕尼盤下一家乾洗店來,讓父母來經營。全家人都湊不夠那麼多錢,她四處向朋友借錢,甚至從高中數學老師那裡借到了錢。

多年後回憶起初到美國的困頓生活,她總是提及她的高中老師,「我真的很感謝那些高中老師們,我當時什麼都不是,就是個移民的小孩」,她回憶說,但這些白人老師願意幫助她。

她自己說那就是「雙城記」,帕西帕尼和普林斯頓。

周一到周五,她在普林斯頓學物理,放學後通過電話參與乾洗店的經營,周末她就回到帕西帕尼給家裡的乾洗店幫忙,接待那些來取送衣物乾洗的人。「我非常愛普林斯頓,不過也非常愛我的洗衣店,缺少了它們中的任何一件,都沒有現在的我」,她說。

1999年,她從普林斯頓畢業。作為一個和父母一路艱辛走來的中國移民女兒,這毫無疑問是一個幫助全家人從經濟困境中解脫出來的最佳時刻。

當時是美股大牛市,就業市場一片大好。她受邀去面試了數家投行和諮詢公司,高盛和麥肯錫都給過她工作offer。如果她就這樣去了華爾街,從此讓全家人過上了富裕的中產生活,也是一個足夠勵志的北京人在紐約的故事了。

她並沒有去華爾街,而是選擇了去西藏研究一年藏葯,「這聽起來很瘋狂」,李飛飛說她自己也知道一般人難以理解她的選擇。

她的父母放棄了北京知識分子生活來到美國,也並不只是為了早日過上美國舒適的生活,他們非常尊重李飛飛的選擇。

從西藏回來後,她選擇繼續讀博,學的是人工智慧和計算神經科學。這意味著這段時間她還是只有微薄的獎學金,全家人仍然要承受經濟的不寬裕。

「人生最大的挑戰其實是不辜負你最大的潛能,又不辜負你身上的責任,以及誠實面對你自己內心所希望追求的事業」,2017年,她在接受CNN採訪時這樣說。

在加州理工讀博士期間,李飛飛媽媽得了癌症,又患了中風。

在《北京人在紐約》那部電視劇里,生活里的困苦拍成了40集連續劇,李飛飛在接受CNN採訪時把這段經歷間斷地描述為,」我們經歷了很多艱難困苦,然後一起挺過來了」,她說,如果加州理工那段經歷發生在她剛剛來美國那段時間——要面臨全新文化和語言的挑戰,她不認為她自己能夠辦得到。

2005年,李飛飛從加州理工獲得了博士學位。

從1995年到2005年,她接受了世界上最好的科學教育。

2

從移民生活的困頓中解脫了出來後,李飛飛一頭扎進關於大的問題的研究當中——如何讓計算機理解圖片。

計算機如果要越來越廣泛地被人們所使用,就必須習得認知畫面的能力。最簡單的例子是,當自動駕駛的汽車前方路面出現了一個障礙物時,計算機需要識別那是個可以輕鬆碾過去的紙袋子還是個應該避開的石頭。

這是認知世界最重要的一部分能力。大自然努力了5億4千年,人類才進化到擁有這個地步。幾十年來,相當一部分計算機研究人員都投身於此。

2005年前後,李飛飛剛成為美國伊利諾伊大學香檳分校的計算機科學教授。對於計算機的圖片識別問題,她發現學術界和AI工業界都在朝著一個方向努力:尋找一個更好的演算法,這個演算法可以提供更好的決策。

但她看到到了這個路徑的局限性——如果這種演算法基於的數據並不能夠反映真實世界,再好的演算法也不會有用。她試圖尋找另一種路徑——構建一個更好的數據集。

在保持對這個問題的思索中時,李飛飛恰巧接觸到了關於WordNet的理論,受到了啟發。

1980年代,普林斯頓大學物理學家喬治·米勒啟動了一個項目叫做「WordNet」,目標是為英語語言搭建一種邏輯結構——有點像詞典,但不是按照字母排列,而是以邏輯關係展現,這種邏輯關係能夠被機器理解和閱讀。

比如,「dog」(狗)這個詞會出現在「canine」(犬)這個詞下,而「canine」(犬)又出現在「mammal」(哺乳動物)這個詞下。以這種方式,WordNet收集了15萬5千多個索引辭彙。

2006年,訪問母校普林斯頓時,李飛飛拜訪了在WordNet領域有影響力的一名學者Chrinstiane Fellbaum教授。Fellbaum給她出了個主意,建議她給WordNet每個單詞配一張圖片,作為一種邏輯關係的索引。

幾個月之後,她回到普林斯頓任教,再幾個月後,2007年初,李飛飛啟動了ImageNet項目——遵循了Fellbaum的建議,給每個單詞配以多個圖片,從而構建一個龐大的數據集。

十年後的2017年,她在接受Quartz 採訪時回憶那段經歷,「那時我們決定做一些史無前例的事情,要描繪整個物理世界」。

李飛飛說的「我們」不過是包括她自己在內的三個人——她聘請了教授研究員Kai Li,Kai後來又說服了博士研究生Jia Deng加入,而Deng一直和李飛飛一起管理這個項目,一直到2017年這個項目結束。

「當時我清楚地知道這將改變視覺研究領域的遊戲規則,但如何改變,卻不清楚」,Jia Deng對Quartz回憶說。

ImageNet 數據集里既包括熊貓、教堂這種具體事物,也包括「愛」這種抽象概念。

他們這個龐大的工程,要從最基礎的工作開始——給WordNet這種邏輯數據集添加照片。

李飛飛的第一個想法就是以10美元每小時的價錢僱傭本科生,讓他們以人工的方式尋找照片並添加進數據集。很快,他們發現,按照這種速度,大約需要90年才能完成照片收集。

叫停這個方案後,李飛飛和團隊重新回到黑板前來討論別的路徑。他們考慮寫一些演算法,讓計算機自己從網上找圖片,然後只是人工審核準確性。又對演算法推敲了幾個月,他們發現這種路徑缺乏持續性——這種演算法只能揀出能夠識別的圖片,而這種識別能力在編程時就限定了的。

李飛飛的目標始終是整個世界。

與此同時,李飛飛還面臨的另一個問題是團隊已經沒有資金了。她四處向聯邦申請資金,得到的回復是對方寫在申請書上嚴厲的批評——為普林斯頓在做這樣的研究而感到羞愧,這個研究唯一的可取之處是這是一個女性主導的研究。

沒有任何一家願意給他們錢,這個項目眼看陷入絕境。

轉機來自於李飛飛和一個研究生偶然間的聊天。那名學生問李飛飛是否知道亞馬遜的 Mechanical Turk 網站——一個眾包平台,可以把任務在這個平台上分發出去,僱傭世界各地的人用電腦遠程完成,費用低廉。

「我真的就是在當天對ImageNet重新燃起了信心」,李飛飛說,「突然間就找到了一種可以大規模完成這個任務的工具,如果僅僅是靠普林斯頓的本科生,ImageNet將是一個不可能實現的夢」。

即便利用 Mechanical Turk 這種高效的工具,數據集最終也花費了兩年半的時間才完成。最終它包含了 320 萬張標記的照片,這些照片被劃分為 5247 個種類,劃分為12個子樹,比如「哺乳動物」、「機車」和「傢具」等。

2009年,李飛飛和團隊發布了ImageNet的論文和數據集,但並不是什麼破繭而出的時刻,外界幾乎沒有什麼反應。

當時在CVPR——計算機視覺研究的前沿會議上,主辦方都不允許他們上台做演講,僅僅是批准他們貼一張海報。沒有辦法,他們只好向與會人員派發印有Imagenet品牌的鋼筆。

他們所有的努力都是基於這樣一種觀點——更多地數據對於演算法是有幫助的,但大部分人對這個觀點持懷疑態度。

Jia Deng對當時的遭遇記憶猶新,「很多人都說,如果你連一個物體都算不好,幹嘛要收集幾千幾萬個物體的數據?」

李飛飛始終是一個有野心的人,她希望更多的人接受她的觀點,「我們意識到如果要更大眾接受這個路徑,那我們要做得更多」,李飛飛說。

在圖片識別研究領域會有一些賽事,大家持自己演算法參賽,對同樣的圖片資料庫做識別,識別率最高者獲勝。李飛飛聯繫到了當時歐洲的一個知名的圖片識別大賽PASCAL VOC,對方同意和她聯名舉辦比賽。

隨著比賽不斷舉辦,ImageNet的名聲越來越大,成為衡量圖像識別演算法性能如何的一個基準。

隨著比賽舉辦到2011年、2012年,研究者們注意到比賽之外的收穫——他們的演算法經過使用 ImageNet 數據集後表現得更好了。李飛飛向外界證明了他們觀點的正確性——更多的數據對於獲得更好的演算法是有用的。

Alex Berg,團隊的第四名成員後來回憶說,「人們驚訝地發現先用 ImageNet 訓練模型,然後再針對其它任務調試模型,這不僅僅是神經網路領域的突破,也是識別領域的重大進展。」

2012年的ImageNet大賽上,發生了一件重要的事情——傑弗·瑞·辛頓(Jeoffrey Hinton)和他的團隊勝出。

那場大賽上,來自加拿大多倫多大學的傑弗瑞·辛頓(Geo rey Hinton)、Ilya Sutskever,和 Alex Krizhevsky 提交了一個叫做 Alexnet 的深度卷積神經網路架構,奪得了當年的 ImageNet 冠軍,圖片識別的正確率比第二名高出達41%。

一直到今天,人們都把深度學習能夠重新獲得生命的原因歸結於這場比賽,從此以後整個人工智慧研究領域都發生了變化。

3

「和辛頓相比,我感到很幸運,因為他堅持研究了二十多年才獲得回報,我等待的時間沒有那麼長,我很敬佩他的堅持和熱情」,在2017年和《國家科學評論》的訪談中,李飛飛這樣說。

辛頓和學生們贏得那場比賽時已經65歲了,因為對深度學習這個領域的堅持,在此之前他完全過著邊緣化的一生。

深度學習的前身叫神經網路,可以把它理解為人工智慧研究中的一個分支,完全迥異於傳統的機器學習學派依靠數學邏輯的路徑。這個分支在1950年代萌芽,他們的核心思想是「訓練」——簡單來說,就是通過一種「獎賞機制」讓機器學會識別新事物。

正因為和傳統路徑迥異,註定了這個學派每次取勝時都會遭到傳統學派的抨擊和詆毀,在幾十年里幾番復活又幾番死去,這個學派的信徒們也不可避免地捲入這種命運沉浮中。

辛頓1970年代在英國愛丁堡開始做研究時,這個學派已經在1950年代短暫地繁榮之後進入了寒冬期。

別人問辛頓「看你挺聰明的一個人,為什麼要做這個?」當時他在論文中只要提到「神經網路」,論文就無法通過同行評審。畢業後,他沒有找到全職的學術工作。

辛頓當時的長期合作夥伴Terrence J. Sejnowski說:「我們都堅信神經網路。可以說是盲目信仰,因為我們不能用數學或其他方法來證明。」但是,當看到基於數學和統計學的人工智慧搞不定諸如圖片識別等難題時,他們知道自己手中握有王牌。

1980年代早期,辛頓來到加州大學聖地亞哥分校做博士後,但最終沒有獲得教職,他回到英國,做著一份無聊的職位。

一個學術路徑未被證明之前,很多人研究人員都不得不像乞丐一樣四處討要資金,這讓這些學術路徑的生死帶有偶然性。在英國的一個半夜,辛頓被一個美國來的電話驚醒,對方表示,願意資助他35萬美元繼續他的研究。

辛頓後來才知道這筆資助的來源:蘭德公司的一個非營利子公司通過開發核導彈攻擊軟體獲得了數百萬美元。因為是非盈利組織,政府以此要求他們,要麼把這筆錢用來支付薪水,要麼儘快散出去,他們選擇把這筆錢散給了辛頓。

因為這筆錢,辛頓等人的研究又復活。到了1980年代末,神經網路隨處可見,他們重返《紐約時報》,好萊塢也以此博取眼球,阿諾德.施瓦辛格扮演的機器人終結者說:「我的CPU是一個神經網路處理器,一個會學習的計算機。」

但冬天很快再次來臨——神經網路可以學習但學的不太好,一個神經網路失敗了,人們也未必清楚其中原因,工程師討厭這種變化無常。在主流機器學習會議上,很難發表任何有關神經網路的內容。

1990年代末開始,深度學習完全進入冰封期,辛頓和一群自稱為「主流機器學習社區棄兒」的人密謀復活神經網路,這些人包括伊恩·樂坤(YannLeCun)——後來主持Facebook人工智慧實驗室的學者,以及後來加入百度的吳恩達等人。「當時每個人都在做著不同的事,莫名其妙地,辛頓說服了他們」,經歷了那場復興運動的樂坤回憶說。

到2004年,他從CIFAR的加拿大組織申請到一筆研究資金,這讓這個組織有了活下去的可能性。

到了2006年,Hinton發表了有關「深度信念網路」的文章,這個人工神經網路被冠以新名稱」深度學習」。

現在看來,那是人工智慧技術大爆發的前夜。也是在那個前後,李飛飛在普林斯頓思考有關數據對演算法的問題,並著手建立ImageNet。

我們不知道兩人之間在當時是否有過交流,但很明顯兩人都在朝著一個有微弱光芒的地方前進——李飛飛對數據問題的強調,正好契合了辛頓的深度學習路徑對於數據需求。

2012年ImageNet大賽的結果,讓深度學習從此成為顯學,李飛飛說,到了2014年時,所有的高分選手都在用深度神經網路。從此,大批的研究資金傾入這一領域,大公司廣泛採用這一路徑—— Facebook 用它來標記用戶照片;特斯拉自動駕駛汽車用它來檢測物體。

ImageNet 數據集的收集和標註花費了李飛飛大量心血,但自從構建以來,它一直秉承開放和自由使用的原則,這也影響了其它大公司在數據上的行為——2016 年穀歌發布了Open Image數據集,DeepMind 今年夏天也發布了自己的視頻數據集。

整個人工智慧領域從此變得不一樣了。

4

2016年,美國最古老的基金會——卡內基基金會,提名李飛飛為當年的傑出移民。每年,他們會選出約40名的已入籍移民予以表彰,以獎勵他們對美國社會所做出的顯著貢獻。

美國是一個移民國家,因此聚集了世界上最聰明的那一批大腦——像李飛飛這樣的人。這種基金會的表彰和提名,本質上是為這一制度和背後的經濟繁榮感到優越和自豪。

在一邊舉辦ImageNet大賽時,李飛飛另一個重要的身份是教書,在普林斯頓之後,2009年她去了斯坦福。

大概是自己是移民的緣故,對於人才是否能夠自由流動,她一直保持警惕。「我見過斯坦福非常優秀的博士生怎麼也得不到綠卡,為世界上的人才創造這麼多的障礙,在我看來是無法想像的」。

另一方面,她又希望留住學生們,大家一起為這個領域努力,而不是跑去華爾街。

姚邦鵬是李飛飛學生之一,從普林斯頓一直跟隨她到斯坦福,是李飛飛手把手教他推公式帶出來的。但姚邦鵬最終決定離開學術界,去了華爾街做金融。

李飛飛對他的決定非常失望。姚邦鵬說,在李飛飛看來,他放棄做學術也就罷了,拒絕了GoogleX和FAIR等公司,去了一個金融小公司,是自毀前程。

但讓他感動的是,畢業前,他去參加一個學術會議,到了機場才發現買錯了票,他說,他在機場給李飛飛打電話,李二話沒說就讓他重新訂機票,並允許報銷。在美國,博士生的工資費用和出差開銷都由導師報銷,「要知道當時她已經看出來我對學術沒有過去那麼熱情了,並且當時她剛休完產假經費並不寬裕」,姚邦鵬在知乎上回憶說。

李飛飛在斯坦福的課總是爆滿,有人說,對她記憶最深的一句話總是她在課堂上那句,「來晚了的同學們,走廊上有小椅子可以坐下」。

在2016年11月,李飛飛自己也加入了工業界,「我將利用學術假期,在谷歌雲計算擔任人工智慧機器學習(Machine Learning, ML)部門的首席科學家。在這段時間裡,我也會繼續和斯坦福的同事、博士後、研究生一起工作」,對於這一作安排,李飛飛自己是這樣解釋的。

實際上,幾乎就在2012年那場ImageNet大賽之後,工業界開始爭奪學術界的人才。谷歌買下了辛頓的公司,讓辛頓去主持谷歌的人工智慧研究;而辛頓當時的夥伴——樂坤被Facebook搶走,吳恩達,斯坦福教授機器學習的重要教授,被百度請去帶領百度人工智慧研究;因此,李飛飛進入谷歌外界也並不意外。

對於這些人來說,谷歌和Facebook這些大公司有他們在學術界難以獲得的機器和數據,而這是研究所不可或缺的。

進入工業界後的李飛飛不忘記強調她的願景。在2017年3月的谷歌雲大會上,李飛飛談及AI「民主化」,強調和呼籲谷歌把平台、演算法以及數據向外界以及其它公司開放,甚至是人才也要和外部公司合作。

這種對AI「民主化」的強調為幾個月後她回到中國埋下了伏筆,2017年12月,李飛飛在上海宣布回國主持谷歌在中國的研究中心。

「我們重點關注基礎AI研究,與學術界建立合作關係,在本土合作上有所建樹,提供AI和機器學習的教育支持。我們很珍惜這次Google和中國頂尖AI人才合作的機會,這些人才也勢必是全球頂尖的AI人才」,在大會上,她這樣介紹這一研究中心。

你也可以看作是對人才的爭奪。谷歌在英國收購了人工智慧創業公司DeepMind之後就竭盡全力的在挖空英國的人工智慧人才,這個創業公司的團隊規模從100 人擴大到了大約 250 人。而現在,這種研究中心在中國的開設,毫無疑問也是如此。

從另一個角度,這些人並不像李飛飛那個時代那樣,僅僅是聚集在美國,他們在英國、在中國和加拿大,這本身就是李飛飛說的「民主化」。

在李飛飛回到中國的時候,辛頓回到加拿大去主持一個國家資助的實驗室,這些人,在二三十年後又以另一種方式在移動,在一個技術更為民主化的現在。

來源:騰訊深網

你的讚賞是我堅持原創的動力

讚賞共 0 人讚賞
推薦閱讀:

震撼真相!中國人在美最新移民報告(多圖) | www.wenxuecity.com
試說洪武趕散與移民蘇北興化
紐西蘭投資移民
中國富人移民潮 傷了誰的心?
厄瓜多最有前途的職業

TAG:移民 |