從洗衣妹到人工智慧首席科學家，這個華裔女孩究竟如何逆襲！

01-23

隨著人工智慧的崛起，一個叫ImageNET視覺識別的挑戰賽（ILSVRC）在近幾年裡備受矚目。

這個挑戰賽要求參賽團隊使用ImageNet——全球最大的圖像識別資料庫，測試他們系統的運行情況。

圖：ILSVRC

而這個計算機視覺領域的「奧賽」，也一直吸引著該領域的頂級研究機構（包括微軟、谷歌、百度等）為之爭得頭破血流。

在2015年，百度還涉嫌在測試過程中作弊，被ImageNet挑戰賽提出禁賽一年。

而提起ImageNet，就不得不說它的背後的締造者——李飛飛。

她不但是這場挑戰賽背後的「美女考官」，還是ImageNet這個全球最大圖像識別資料庫的主創者。

圖;李飛飛

李飛飛，這三個字幾乎是AI（人工智慧）界無人不曉的名字。

她不僅是斯坦福AI實驗室主任，還是斯坦福大學的終身教授。

在頂級期刊上，她的高質量文章就有100篇以上，引用量更是高達33215-44773次。

2015年入選「世界百大思想者」，2016年她還被美國評為「年度傑出移民」之一，以前獲此殊榮的還有愛因斯坦、基辛格等

前一陣子，谷歌宣布李飛飛成為谷歌雲計算首席科學家，也在業界更是引起了不少轟動。

此前，李飛飛一直都專註於實驗室，與業界聯繫不深。

她現在走出實驗室的舉動，讓許多人都對人工智慧的發展了充滿信心。

然而，這位站在金字塔頂端的女科學家背後，卻有著一段鮮為人知的勵志人生。

早年的她竟然還有過清潔工、中餐館收銀員、幫人遛狗、開乾洗店等工作經驗。

...

1976年出生的李飛飛在四川長大。

16歲時，她便隨父母遠渡重洋來到充滿希望的美國，落戶在新澤西洲的Parsippany小鎮。

但李飛飛並不是富二代，父母都是清貧的知識分子。

初到美國，對英語一竅不通更是全家最大的阻力。

光是擇校問題，她就奔波了好幾個月，費了九牛二虎之力才得以在當地一所排名中游的學校上學。

圖：李飛飛一家

那時，爸爸去幫別人修相機，媽媽就去當收銀員。

但這類工作的收入，完全不足維持生活和支付她的學費。

所以到美國後的很長一段時間，李飛飛生活的關鍵詞就是「謀生」二字。

在唐人街附近的很多零工，包括收銀員、清潔工、服務生等她都做過。

圖;高中時期的李飛飛

然而在打工之餘，李飛飛卻還要應對兩年後的美國大學入學。

作為新一代移民學子，她不但要迅速掌握英語，還要拿出一份極其優秀的成績單，才能考上好的大學。

那時候，打工和學習幾乎佔滿了她的全部生活。

最辛苦時，一天只睡不到4個小時。

圖：1995年，Parsippany鎮上關於李飛飛的報道

只要你想，全世界都會為你讓路。

憑著這股毅力，這位華裔少女收到了普林斯頓大學計算機系的offer，還是提供全額獎學金的那種。

當時這個消息在小鎮上算是個大新聞，還有報紙專門刊登了她奮鬥的故事，稱她的「美國夢」成真啦！

圖：李飛飛在普林斯頓大學

在普林斯頓大學她接觸到了大量優秀的人才，這對她而言更是莫大的鼓舞。

然而，在大學她依然不改拚命三郎的性格。

看著父母還是做著入不敷出的零工，李飛飛決意借錢買下了一家洗衣店，交給父母經營。

從此，她也就過上了周一到周五在普林斯頓拚命學習，周六日則趕回家中，繼續當洗衣妹的日子。

她不但獨立，渾身上下更是散發著對生活的熱愛。

「我愛普林斯頓，也非常愛我的洗衣店」

「我覺得辛苦不算什麼，因為我父母也同樣在努力工作。我們一家人只是為了好好地生活。」

1999年，李飛飛從普林斯頓大學畢業。

然而，那時的她卻拒絕了多家金融公司的工作邀請。

在父母的支持下，開始追隨自己的內心，毅然踏上一年的西藏之路研究藏醫。

圖：李飛飛在西藏的日子

完成了這一夢想後，她再次拒絕了華爾街的高薪工作，開始了下一個夢想——讀博士。

然而，在讀博期間，她的母親卻不幸得了癌症，之後又中風。

生活的重擔幾乎壓得她喘不過氣來。

「人生最難的不就是，如何發揮自己最大的潛能，同時兼顧自己所身負的責任，然後又必須忠於自己的內心嗎？」

而李飛飛用自己的行動告訴我們，她做到了！

...

在博士畢業後，她進入了斯坦福大學AI實驗室，選擇了當時不被看好的研究方向——計算機視覺識別領域。

通俗的說，就是拿一張圖片，讓計算機認出來這張圖片所包含的內容。

比如，你告訴計算機，「貓」是由圓臉、胖身子、兩隻尖耳朵和一條長尾巴組成的東西。

然而在現實生活中，貓就有成千上萬個品種，就算是同一隻貓，也能擺出上百種姿勢。

如果遇到一些骨骼清奇的貓，換個姿勢計算機估計就懵逼了。

那個時候，圖像識別已經走過了20個年頭。

但全世界能夠識別的物體也不過4到20種。

然而大千世界這麼多的物品，如果計算機只能識別豹子、飛機、人臉和汽車這幾樣是遠遠不夠的。

面對圖像識別如此匱乏的「辭彙量」，李飛飛產生了一個瘋狂的想法。

她拿出一本字典，決定要讓圖像識別涵蓋到字典里的每一個詞條。

圖：李飛飛與導師

當她把這個想法告訴其他教授時，大家都紛紛勸她換個方向，因為研究這個是「拿不到終生教授」的。

她還找了好幾個教授想要尋求合作，也全然被拒絕了，都認為「看不到結果」，「不值得」。

但是李飛飛卻沒有想那麼多，先別管「終生教授」的事，首先要做好自己認為重要的事情。

圖：李飛飛在斯坦福大學授課

剛開始時，李飛飛將很大部分的精力都放在演算法的優化上，然而這並沒有帶來太大的突破。

突然有一天，一個非常簡單但卻非常有衝擊力的想法，使李飛飛找准了方法。

她想，沒人教嬰兒怎麼「看」，也沒有人告訴他們「貓」的特徵。

但是他們卻能夠很快的知道這就是貓，無論什麼品種或什麼形態。

因為人類的眼睛就好像一個生物照相機，每200毫秒就能獲取一幅圖片。

一個三歲的孩子就已經見過上億副圖片了，能分辨圖片當然不在話下。

所以要讓計算機學會「識圖」，關鍵是在於訓練量——讓計算機看更多的圖片。

從2007起，李飛飛與團隊便從互聯網上下載了近10億幅圖片。

在這之後便是對這些圖片進行分類、打上標籤，為計算機提供學慣用的「題庫」，而這個「題庫」就是現在的ImageNet。

然而，當他們給圖片打標籤打了幾個月後，研究經費很快用完了。

而且按照這個速度，至少得十幾年才能完成目標，因為圖片實在是太多了。

但李飛飛卻從來沒想過放棄，在最困難時，她甚至還想重操舊業開洗衣店，為研究籌集經費呢。

正當大家一籌莫展時，他們遇到了美國最大電商平台——亞馬遜。

當然不是在上面買書，而是和亞馬遜的眾包平台合作。

通過眾包平台，李飛飛在網上僱傭到了來自167個國家的5萬人，為這十億張備選圖片篩選、排序、打標籤。

當時的李飛飛，一度是這個眾包平台上最大僱主。

到2009年，ImageNet資料庫就包含了1500萬張照片，涵蓋了20000多種物品。

回想在2006年那4到20種物品，ImageNet資料庫無論在質量還是數量上，都是空前的。

然而，最重要的是，ImageNet這個如此龐大的圖片資料庫竟然是免費的。

這就意味著，全球所有致力於計算機視覺識別的團隊，都能從這個題庫裡面拿「試題」，來測試自家演算法的準確率。

圖：ImageNet挑戰賽的機器錯誤率，七年來從28%降到了3.6% ，比人眼識別的錯誤率5.1%還要低。

為了激發各界對計算機視覺研究的熱情，李飛飛每年都會舉行一場ImageNet視覺識別挑戰賽。

在這場考試中，無論挑戰者的輸與贏都代表著一次新的發展。

如果考生能輕易答對「試題」，這就說明了視覺識別技術的更上一層樓。

但如果「試題」難倒了考生，也不用擔心，這也意味著演算法的突破口就在這。

不過，對於現在一度「過熱」的人工智慧，李飛飛也一直在強調「人工智慧現在越火，越需要有冷靜做研究的人」

她說「我做研究的心得就是，眼睛看到的前方應該是比較空曠的。如果你眼睛看到的前方是熱鬧的，那這個方向就不是最好的研究方向。而空曠的地方一般都不是熱點，因此你必須找准自己的焦點」

圖：李飛飛首度亮相谷歌雲大會

關於未來的AI開發，李飛飛認為不但要在學術上還要結合工業上的開發。

因為AI的最終目的就是服務於人類，這也是李飛飛加入谷歌的原因。

為的就是拉近AI與人類日常生活的距離，使AI"更接地氣"。

圖：谷歌街景搜集的車輛數據

在今年2月末，李飛飛又發表了最新的論文：《用深度學習和谷歌街景估算美國人口結構》。

文章主要論述了如何將谷歌街景搜集來的機動車輛數據，結合機器學習演算法。

從而估算出本地區人口的特徵和組成，甚至這一地區居民的政治傾向。

在李飛飛看來，目前的圖像識別和人工智慧，還相當於一個牙牙學語的3歲孩童。

而3歲到10歲的過程，才是人工智慧的難點和關鍵。

就算李飛飛說圖像識別的路還有很遠，但也完全不妨礙我們暢想未來。

去超市買東西，直接「刷臉」付款；

在追擊違法分子上，可能罪犯剛一上街就已經被一雙神秘的眼睛鎖定；

圖gif：完全不用看紅綠燈的「未來式過馬路」

在未來交通上，人們不用自己抓方向盤，也有「老司機」帶你飛；

在醫療上，醫生和護士會多了一雙永遠不用休息的眼睛，幫忙診斷和照顧病人；

在TED演講的結尾，李飛飛表示：

她現在所有的追求，就是賦予計算機視覺智能，並為Leo（她的兒子）和這個世界，創造出更美好的未來。

這個集才華與美貌於一身的女子，能把人類帶到哪個未知領域，我們也翹首以待。