阿里巴巴的AI演算法程序媛是怎樣的一種存在?
來自專欄我是程序員
摘要:一個專註人臉識別技術長達11年的程序媛。
程序媛、AI、演算法、人臉識別、阿里安全圖靈實驗室……這些標籤任何一個都極具話題性,但如果一個女子同時擁有這些標籤,那會是怎樣的存在?
在見到於鯤之前,我的腦子裡是各種的想像,萌妹紙?御姐?還是?儘管於鯤說話語速有點快,但乾脆利落,邏輯清楚,所以「幹練」是她留給我的最深的印象。
阿里安全圖靈實驗室的AI演算法程序媛於鯤在阿里巴巴這幾年的錘鍊,於鯤已經成長為國內人臉核心演算法領域的頂級專家。作為阿里安全圖靈實驗室的核心成員,研發了業界頂級水準的人臉識別技術和演算法,無論是1:1人臉比對還是1:N人臉搜索的演算法,效果都在業內處於優勢地位。目前,線上的人臉比對核心演算法模型,就是於鯤和小夥伴們一起訓練和開發的。
不僅如此,於鯤還出色地緊貼業務場景,將技術成果完美落地。她主導了新零售(如未來美家、銀泰百貨、盒馬等)和其他1:N線下業務(包括園區門禁,菜鳥快遞取件櫃等)的人臉比對演算法;同時,還協同了1:1實人認證(手淘掃臉登錄等)和1:N敏感人臉檢測(內部和綠網)等重要業務演算法的研發。
與用戶直接互動「很刺激」
2014年,於鯤接觸到阿里巴巴,然後被深深地吸引。
「我覺得實人認證和內容管控是非常有前景的,而且可以和終端用戶直接互動。」於鯤說,「這對於做技術的人來說,是非常有吸引力的,也挺有成就感的。」
於鯤認為,像是實人認證這種,如果技術層面沒有做好,就會導致體驗下降。但不管是技術原因還是業務原因,導致客戶的流程沒有走下去,用戶就會給到最為直接的反饋。比如掃臉登錄,用戶的反應是最為直觀的,用戶所能接受的極限時間為2秒鐘,這對技術提出了極高的要求。
「對於技術人員來說,來自於用戶的直接反饋是一種最為難得的體驗。「於鯤強調。
由於演算法是偏後端的,所以和前台用戶的互動,讓於鯤覺得是一種「很刺激「的體驗。
在於鯤眼中,阿里巴巴這種大平台確實很吸引人。比如實人認證,規模很大,有數億人在使用。對於絕大多數技術人員來說,這並不是一個很容易得到的機會。
在阿里巴巴是一種全新的體驗
從2007年到現在,於鯤一直在做人臉識別技術的研究和開發。
從技術層面來看,於鯤算是輕車熟路,但這並不意味著前面是一片坦途。「對我來說,其實還是蠻挑戰的,因為需要角色有巨大的轉變。」於鯤說。
於鯤介紹,她之前一直在傳統企業做人臉技術的研發,但是到了阿里巴巴這種頭部互聯網公司後,需要對自己進行革新。包括企業的文化、工作的流程等,這些對於鯤都是全新的體驗。
「總體感覺是阿里的節奏非常快,開始還有些不太適應。」於鯤說。她覺得自己每天都是在小跑著前進,面對的業務比較複雜,對接的團隊也很多。每天多數時間都在開會中度過,基本上晚飯後的時間才是屬於自己的,此時才會坐下來做一些事情。「基本上,白天不是在開會就是在去開會的路上。「於鯤笑稱。
萬事開頭難。但通過不斷的交流和磨合,於鯤和小夥伴們越來越有默契,溝通越來越順暢,對業務也越來越了解,項目推動起來也就「得心應手」了。兩年之後,於鯤完全適應了這裡,適應了快節奏,適應了新環境。心裡也就自然而然地認為,「本來就應該是這樣的。」
「現在,如果是慢節奏,我反而不習慣了,會覺得是在浪費時間,浪費生命。」於鯤說,「工作就應該是這樣的。」
於鯤告訴我,她覺得到了阿里巴巴就是打開了新的一頁,體會到了不同的人生。
程序媛並不是一種獨特的存在
阿里安全圖靈實驗的研究方向非常穩定,就是專註於計算機視覺、自然語言處理、機器學習和深度學習;其聚焦的業務也非常穩定,就是為手淘、天貓、支付寶、閑魚、優酷土豆、UC、阿里媽媽等核心業務線提供技術支撐,並對外輸出AI能力。因此,整個團隊也非常穩定。
阿里安全圖靈實驗室的部分技術同學這幾年,於鯤一直在阿里安全圖靈實驗室。據她介紹,整個團隊有5個程序媛,3個Base杭州,2個Base北京。「我們團隊的氛圍特別好,大家在一起就是『哥們兒』,會互相分享好的idea,像一家人似的。」於鯤說,「所有人同心協力,朝著同一個方向,同一個目標發力。」
於鯤認為,大家在團隊大目標之下,只有分工的不同,小夥伴們更多的是相互補位和背靠背的方式進行協作。「這個事情交給你,這個事情到此為止。就是這麼簡單的邏輯。」於鯤說。
於鯤笑著說,她之所以留著長發只是想保留自己女生的特徵,但幹活兒從來沒有把自己當成一個特殊的存在,要享受特殊待遇。相反地,她認為自己從業的時間比較長,所以應該更多地去承擔一些事情。
有想法就盡情去發揮
團隊穩定與否,Leader很重要。這是於鯤的觀點。
在她眼中,阿里安全圖靈實驗室的負責人奧創是一個很有想法,有大局觀的人。正因為如此,整個團隊的氛圍很和諧,也沒有什麼職級之分。
於鯤還記得,某年的中秋節,奧創拎著大閘蟹來到公司,然後分給團隊的小夥伴們。「Leader有什麼事情,都會想到團隊成員,這非常棒!」於鯤說。
對比傳統企業和互聯網公司,於鯤也談了自己對於技術團隊的一些理解。她認為,團隊好不好,要看Leader有沒有遠見,有沒有前瞻性。傳統企業的技術團隊,Leader把任務拿來,然後給到團隊成員去落實,這是一種自上而下研發模式。但是在阿里巴巴不一樣,這裡是一種自下而上的模式,也就是說,組織的目標就在那裡,每個團隊成員都能看到,每個人能為這個目標做什麼?團隊成員是自發的,也就是阿里巴巴一直強調的自組織、自驅動,每個人都內心驅動。
「整個團隊都是這樣的,整個阿里也是這樣的。」於鯤說,「雖然有KPI的考核,但每個團隊都在思考還可以做些什麼?每個人也在想我可以做些什麼?這個力量是無窮的。」
於鯤認為,自上而下的指令,很多時候只是Leader一個人的思考,所以具體落地的時候可能結果並不好;但如果是自下而上,那麼每個人的想法都能得到充分發揮,每個人都會貢獻自己的智慧去為大目標做有益的工作,這是一種積少成多的力量。
「阿里巴巴的工作模式就是,有想法就盡情去發揮。」於鯤說。
演算法人靠「數字」說話
在阿里巴巴西溪園區,刷臉設備已經替代了傳統的刷卡門禁,這就是於鯤和團隊小夥伴們的傑作。實際上,這是經過了內部激烈的技術PK之後,最終被阿里安全圖靈實驗室拿下的。
「演算法人是要靠數字說話的,誰的準確率高,誰就上。」於鯤告訴我,阿里安全圖靈實驗室研發的人臉識別系統在準確率方面拔得頭籌,因此才拿下了園區的門禁刷臉項目。
不僅在內部取得不俗的成績,在與外部友商的競爭中,阿里安全圖靈實驗室也順利拿下了某機場的安檢項目,而實驗室還通過阿里雲上的「實人認證」和「內容安全」兩大產品,服務了數萬家企業客戶。
「我們的業務都依託於我們的技術,因此,我們的技術並不是為了在某個競賽得獎而進行研發的,而是為了充分保障業務的順暢應用,為用戶提供極致的體驗。」於鯤告訴我,阿里安全圖靈實驗室實際上也經常會在一些大賽上斬獲殊榮,但通常情況下,這些都不過是技術小夥伴們做好業務項目之餘的「副業」而已。
於鯤告訴我,阿里安全圖靈實驗室的目標是要做最頂尖的演算法團隊,並保持領先的地位。
用技術改變生活
於鯤向我普及了一下人臉識別技術的發展簡史。
90年代初,手機還未普及,關於人臉識別的應用還非常初級,通常都是簡單的特徵分類,比如幾何或者灰度特徵。
2003年到2004年的時候,人臉識別技術開始轉向圖像領域的傳統特徵,那時,更多的是需要看工程師對圖像的理解,是非常挑戰的。不過,已經有一些比較初級的商業應用,比如一些考勤機。
到了2012年,深度學習進入到爆發期。隨著這一波的大發展,人臉識別也是獲益最為典型的應用之一。那個時候,不管是數據還是演算法,人臉識別都已經準備好了,可以隨時「起飛」。
最近的兩三年,人臉識別主要是在做用戶習慣的培養,畢竟還是有很多人不太能夠接受,但這個現狀正在發生著巨變。比如掃臉支付、掃臉轉賬等,它們具備的便捷性是以往任何一種技術都無法比擬的。
於鯤告訴我,在人臉識別技術方面,中國是非常領先的,在用戶習慣的培養方面也是領先的。每年,國家在這一領域的科研投入,比如論文數量或專利數量在全球來看都是處於前列。
事實上,於鯤從事人臉識別技術的研究與開發已經11年,因此很多人都會奇怪她會不會厭煩了?或者說是否需要換一個方向?她並沒有這樣的想法。她認為,人臉識別並不是一個單點的技術,而是一整套的解決方案,除了方案本身,它底層的技術也是複合型的。
「人臉一直會在持續的變化,比如化妝、比如美容、比如衰老,比如光照等,這些都會導致人臉的變化。這些變化,遠比其他模型要複雜得多。這對於機器來說,是極大的挑戰。」於鯤說,「正因為人臉識別所具備的複雜性,所以才會有這麼長時間,這麼多人去研究。」
於鯤覺得,人臉識別是一個非常好的點,應用場景非常多,商業的可能性也很多,所以它能夠成為當前的熱點。
「這幾年人臉的應用越來越廣,其實並不是我們站在這個風口,而是說整個行業站在了這個風口。資本瘋狂追逐,各大公司也巨額投入,這些都說明其市場前景巨大。」於鯤表示。
「我想能夠用技術服務大眾,真正的用技術改變生活,用技術去除惡揚善,這是我的夢想,相信也是每個技術人的夢想。」於鯤說。
推薦閱讀:
※人工智慧的應用也許會徹底割裂人類社會
※大數據時代的新變數
※智能學習檢測
※Hello, Vision
※駕馭AI:好的數據集是成功的一半
TAG:人工智慧 |