從洗衣妹到人工智慧首席科學家,這個華裔女孩究竟如何逆襲!
隨著人工智慧的崛起,一個叫ImageNET視覺識別的挑戰賽(ILSVRC)在近幾年裡備受矚目。
這個挑戰賽要求參賽團隊使用ImageNet——全球最大的圖像識別資料庫,測試他們系統的運行情況。
圖:ILSVRC
而這個計算機視覺領域的「奧賽」,也一直吸引著該領域的頂級研究機構(包括微軟、谷歌、百度等)為之爭得頭破血流。
在2015年,百度還涉嫌在測試過程中作弊,被ImageNet挑戰賽提出禁賽一年。
而提起ImageNet,就不得不說它的背後的締造者——李飛飛。
她不但是這場挑戰賽背後的「美女考官」,還是ImageNet這個全球最大圖像識別資料庫的主創者。
圖;李飛飛
李飛飛,這三個字幾乎是AI(人工智慧)界無人不曉的名字。
她不僅是斯坦福AI實驗室主任,還是斯坦福大學的終身教授。
在頂級期刊上,她的高質量文章就有100篇以上,引用量更是高達33215-44773次。
2015年入選「世界百大思想者」,2016年她還被美國評為「年度傑出移民」之一,以前獲此殊榮的還有愛因斯坦、基辛格等
前一陣子,谷歌宣布李飛飛成為谷歌雲計算首席科學家,也在業界更是引起了不少轟動。
此前,李飛飛一直都專註於實驗室,與業界聯繫不深。
她現在走出實驗室的舉動,讓許多人都對人工智慧的發展了充滿信心。
然而,這位站在金字塔頂端的女科學家背後,卻有著一段鮮為人知的勵志人生。
早年的她竟然還有過清潔工、中餐館收銀員、幫人遛狗、開乾洗店等工作經驗。
...
1976年出生的李飛飛在四川長大。
16歲時,她便隨父母遠渡重洋來到充滿希望的美國,落戶在新澤西洲的Parsippany小鎮。
但李飛飛並不是富二代,父母都是清貧的知識分子。
初到美國,對英語一竅不通更是全家最大的阻力。
光是擇校問題,她就奔波了好幾個月,費了九牛二虎之力才得以在當地一所排名中游的學校上學。
圖:李飛飛一家
那時,爸爸去幫別人修相機,媽媽就去當收銀員。
但這類工作的收入,完全不足維持生活和支付她的學費。
所以到美國後的很長一段時間,李飛飛生活的關鍵詞就是「謀生」二字。
在唐人街附近的很多零工,包括收銀員、清潔工、服務生等她都做過。
圖;高中時期的李飛飛
然而在打工之餘,李飛飛卻還要應對兩年後的美國大學入學。
作為新一代移民學子,她不但要迅速掌握英語,還要拿出一份極其優秀的成績單,才能考上好的大學。
那時候,打工和學習幾乎佔滿了她的全部生活。
最辛苦時,一天只睡不到4個小時。
圖:1995年,Parsippany鎮上關於李飛飛的報道
只要你想,全世界都會為你讓路。
憑著這股毅力,這位華裔少女收到了普林斯頓大學計算機系的offer,還是提供全額獎學金的那種。
當時這個消息在小鎮上算是個大新聞,還有報紙專門刊登了她奮鬥的故事,稱她的「美國夢」成真啦!
圖:李飛飛在普林斯頓大學
在普林斯頓大學她接觸到了大量優秀的人才,這對她而言更是莫大的鼓舞。
然而,在大學她依然不改拚命三郎的性格。
看著父母還是做著入不敷出的零工,李飛飛決意借錢買下了一家洗衣店,交給父母經營。
從此,她也就過上了周一到周五在普林斯頓拚命學習,周六日則趕回家中,繼續當洗衣妹的日子。
她不但獨立,渾身上下更是散發著對生活的熱愛。
「我愛普林斯頓,也非常愛我的洗衣店」
「我覺得辛苦不算什麼,因為我父母也同樣在努力工作。我們一家人只是為了好好地生活。」
1999年,李飛飛從普林斯頓大學畢業。
然而,那時的她卻拒絕了多家金融公司的工作邀請。
在父母的支持下,開始追隨自己的內心,毅然踏上一年的西藏之路研究藏醫。
圖:李飛飛在西藏的日子
完成了這一夢想後,她再次拒絕了華爾街的高薪工作,開始了下一個夢想——讀博士。
然而,在讀博期間,她的母親卻不幸得了癌症,之後又中風。
生活的重擔幾乎壓得她喘不過氣來。
「人生最難的不就是,如何發揮自己最大的潛能,同時兼顧自己所身負的責任,然後又必須忠於自己的內心嗎?」
而李飛飛用自己的行動告訴我們,她做到了!
...
在博士畢業後,她進入了斯坦福大學AI實驗室,選擇了當時不被看好的研究方向——計算機視覺識別領域。
通俗的說,就是拿一張圖片,讓計算機認出來這張圖片所包含的內容。
比如,你告訴計算機,「貓」是由圓臉、胖身子、兩隻尖耳朵和一條長尾巴組成的東西。
然而在現實生活中,貓就有成千上萬個品種,就算是同一隻貓,也能擺出上百種姿勢。
如果遇到一些骨骼清奇的貓,換個姿勢計算機估計就懵逼了。
那個時候,圖像識別已經走過了20個年頭。
但全世界能夠識別的物體也不過4到20種。
然而大千世界這麼多的物品,如果計算機只能識別豹子、飛機、人臉和汽車這幾樣是遠遠不夠的。
面對圖像識別如此匱乏的「辭彙量」,李飛飛產生了一個瘋狂的想法。
她拿出一本字典,決定要讓圖像識別涵蓋到字典里的每一個詞條。
圖:李飛飛與導師
當她把這個想法告訴其他教授時,大家都紛紛勸她換個方向,因為研究這個是「拿不到終生教授」的。
她還找了好幾個教授想要尋求合作,也全然被拒絕了,都認為「看不到結果」,「不值得」。
但是李飛飛卻沒有想那麼多,先別管「終生教授」的事,首先要做好自己認為重要的事情。
圖:李飛飛在斯坦福大學授課
剛開始時,李飛飛將很大部分的精力都放在演算法的優化上,然而這並沒有帶來太大的突破。
突然有一天,一個非常簡單但卻非常有衝擊力的想法,使李飛飛找准了方法。
她想,沒人教嬰兒怎麼「看」,也沒有人告訴他們「貓」的特徵。
但是他們卻能夠很快的知道這就是貓,無論什麼品種或什麼形態。
因為人類的眼睛就好像一個生物照相機,每200毫秒就能獲取一幅圖片。
一個三歲的孩子就已經見過上億副圖片了,能分辨圖片當然不在話下。
所以要讓計算機學會「識圖」,關鍵是在於訓練量——讓計算機看更多的圖片。
從2007起,李飛飛與團隊便從互聯網上下載了近10億幅圖片。
在這之後便是對這些圖片進行分類、打上標籤,為計算機提供學慣用的「題庫」,而這個「題庫」就是現在的ImageNet。
然而,當他們給圖片打標籤打了幾個月後,研究經費很快用完了。
而且按照這個速度,至少得十幾年才能完成目標,因為圖片實在是太多了。
但李飛飛卻從來沒想過放棄,在最困難時,她甚至還想重操舊業開洗衣店,為研究籌集經費呢。
正當大家一籌莫展時,他們遇到了美國最大電商平台——亞馬遜。
當然不是在上面買書,而是和亞馬遜的眾包平台合作。
通過眾包平台,李飛飛在網上僱傭到了來自167個國家的5萬人,為這十億張備選圖片篩選、排序、打標籤。
當時的李飛飛,一度是這個眾包平台上最大僱主。
到2009年,ImageNet資料庫就包含了1500萬張照片,涵蓋了20000多種物品。
回想在2006年那4到20種物品,ImageNet資料庫無論在質量還是數量上,都是空前的。
然而,最重要的是,ImageNet這個如此龐大的圖片資料庫竟然是免費的。
這就意味著,全球所有致力於計算機視覺識別的團隊,都能從這個題庫裡面拿「試題」,來測試自家演算法的準確率。
圖:ImageNet挑戰賽的機器錯誤率, 七年來從28%降到了3.6% ,比人眼識別的錯誤率5.1%還要低。
為了激發各界對計算機視覺研究的熱情,李飛飛每年都會舉行一場ImageNet視覺識別挑戰賽。
在這場考試中,無論挑戰者的輸與贏都代表著一次新的發展。
如果考生能輕易答對「試題」,這就說明了視覺識別技術的更上一層樓。
但如果「試題」難倒了考生,也不用擔心,這也意味著演算法的突破口就在這。
不過,對於現在一度「過熱」的人工智慧,李飛飛也一直在強調「人工智慧現在越火,越需要有冷靜做研究的人」
她說「我做研究的心得就是,眼睛看到的前方應該是比較空曠的。如果你眼睛看到的前方是熱鬧的,那這個方向就不是最好的研究方向。而空曠的地方一般都不是熱點,因此你必須找准自己的焦點」
圖:李飛飛首度亮相谷歌雲大會
關於未來的AI開發,李飛飛認為不但要在學術上還要結合工業上的開發。
因為AI的最終目的就是服務於人類,這也是李飛飛加入谷歌的原因。
為的就是拉近AI與人類日常生活的距離,使AI"更接地氣"。
圖:谷歌街景搜集的車輛數據
在今年2月末,李飛飛又發表了最新的論文:《用深度學習和谷歌街景估算美國人口結構》。
文章主要論述了如何將谷歌街景搜集來的機動車輛數據,結合機器學習演算法。
從而估算出本地區人口的特徵和組成,甚至這一地區居民的政治傾向。
在李飛飛看來,目前的圖像識別和人工智慧,還相當於一個牙牙學語的3歲孩童。
而3歲到10歲的過程,才是人工智慧的難點和關鍵。
就算李飛飛說圖像識別的路還有很遠,但也完全不妨礙我們暢想未來。
去超市買東西,直接「刷臉」付款;
在追擊違法分子上,可能罪犯剛一上街就已經被一雙神秘的眼睛鎖定;
圖gif:完全不用看紅綠燈的「未來式過馬路」在未來交通上,人們不用自己抓方向盤,也有「老司機」帶你飛;
在醫療上,醫生和護士會多了一雙永遠不用休息的眼睛,幫忙診斷和照顧病人;
在TED演講的結尾,李飛飛表示:
她現在所有的追求,就是賦予計算機視覺智能, 並為Leo(她的兒子)和這個世界, 創造出更美好的未來。
這個集才華與美貌於一身的女子,能把人類帶到哪個未知領域,我們也翹首以待。
推薦閱讀:
※OpenCV為什麼不出自己的的深度學習框架?如果出了,還有caffe和mxnet什麼事嗎?
※基於tensorflow的最簡單的強化學習入門-part0:Q-learning和神經網路
※阿爾法狗走出電腦,它們現在控制著機器人,自己學會了開門!
※Dimensionality Reduction——LDA線性判別分析實現篇
※Facebook 能主動監測出自殺傾向的用戶,並及時提供援助