稀土· Meetup| 「碰撞最前沿的圖像識別技術」活動總結
稀土Meetup 是由稀土團隊發起並組織的系列高質量互聯網技術線下聚會,目的是聯合最具權威的互聯網技術公司及技術專家來分享時下技術熱點。
第一期活動,我們就很榮幸的選中了當下前沿應用技術為出發點,希望和大家一起了解此類技術的實現原理、API 使用成本及其應用場景。而本次的活動的合作公司則是在這個行業里最具影響力的初創企業 SenseTime 並邀請其執行研發總監曹旭東作為活動的主講嘉賓。SenseTime 業務發展迅速,已經成為國內此類解決方案的主要提供商,因此活動同時邀請了其服務的幾家公司的技術人員共同參與。
SenseTime 是一家科技創新公司,致力於打造新一代的計算機視覺理解和人工智慧引擎,讓計算機可以識人、識物、看懂這個世界。SenseTime 的領先技術涵蓋人臉識別、圖像識別、圖像處理、智能監控等多個領域。其提供的高質量圖像識別技術已被眾多知名公司及產品使用,如:京東錢包、借貸寶、銀聯、新浪微博、小米、FaceU 等等產品當中。
主講嘉賓曹旭東曾任職微軟亞洲研究院,專攻人臉方向,其負責研發的人臉演算法曾用於微軟 Xbox、How-old 等知名產品。 發表十餘篇 CVPR/ICCV/ECCV 等計算機視覺頂級會議論文,其中三篇 CVPR 論文、兩篇ICCV論文獲得口頭報告榮譽(錄取率 5%)
由於本次活動內嘉賓分享了眾多 SenseTime 內部最新研發成果及行業內的討論,部分保密內容已保密。
深度學習雖然是時下最流行的主題,並且各大互聯網公司都在爭相發展這一個被預測可在未來有極大價值的技術,但是很多人可能不知道這是一個幾經波折的學術領域。
歷史
早在 1965 年,Alexey Grigorevich Ivakhenko 就發表了非常早期的擁有 multiple layers of non-linear features 的演算法並引出了 Perceptron (神經網路)的概念。可惜在 1969 年,當時的演算法被證明無法解決一些簡單的 pattern 且諸多 AI 相關學科的發展及投入都未有極大的產出,這使得整個行業迎來的 AI Winter。之後的幾次技術的突破都使得 AI 偶然復興卻又因為一些技術的限制和瓶頸又歸於沉寂,例如 1980 年代推出的 Backpropagation Algorithm 及 2006 年 Geoffrey Hinton 發表的 Restricted Boltzmann Machine。直到 2012 年,Deep Learning 的研究成果在圖像識別領域獲得了極大的成果,Geoffrey Hinton 團隊由 Alex Krizhevsky 發布的 AlexNet 獲得了 ImageNet 比賽的冠軍且結果遠超舊的實現方法,且結果也已超越了人類可達到的水平。
自此之後,Deep Learning 終於在實現層產生了遠超前面 CNN 結果的方法,這使得眾多深度學習的技術公司獲得了大型科技企業的認可及投入,行業終於繁榮,其中比較有名的自然是創造了 AlphaGo 並被 Google 以 400 萬美元收購的 DeepMind 公司。
為什麼 Deep Learning 如此受大公司歡迎?
1. 相較於之前的升維方法,深度學習雖然還未能被數學完全解釋且計算力消耗巨大,單它尤其適用於大量數據的訓練,且結果提升是指數級的。但是,隨著其他數字企業的崛起,大型數據不斷積累聚集且硬體摩爾定律使得計算成本不斷降低。由於深度學習的結果精度是線性正比於數據大小,這使得它的性能可以不斷進步直到滿足實用需求。
2. 深度學習的重要之處在於 Networks Design,此外的主要行為都包含在了數據收集及訓練結果,這樣需要了解的外圍 domian knowledge 則大幅度減少。且一個設計優秀的 Network 可以移植在不同的問題解決上,都可以得到不錯的結果!
3. 這是一個一旦領先就很難被超越的技術,網路設計及數據量是一個好的 Deep Learning 結果賴以生存的基本,但是一個 Network Design 被證明有效後就會被大範圍使用並獲得更多的數據集來訓練。這樣發展下去,則它的優勢會不斷擴大。具體的例子:當 SenseTime 的 Net 被證明效果好過市場上的其他產品,它就會獲得如微博、美圖等公司的數據從而更快地提高其訓練的結果及精度。
快問快答
大數據、人工智慧毫無疑問是當下最火的額話題,一般程序出身的開發者是否能參與其中的工作?需要哪些能力?
曹旭東:最重要的就是參與到公司的工作中去,因為那些小數據集的機器學習方法及結果和在大數據情況下的結果不完全相同。儘快投入到真實的有技術實力的深度學習技術公司是非常重要的。理論研究要有相應的數學、 計算機知識背景,工業級產品則編程能力最重要。
Google / Facebook / Microsoft / Baidu 等大公司都在做人工智慧相關的項目,您是如何看到這幾個公司的核心產品?何時這些產品才會完全進入到我們的生活中?
曹旭東:Facebook 我不太了解,之前在微軟曾待過並且他們很多的圖像識別研究成果都已經融入到真實的產品之中,如人臉認證等。而 Google 正在大力推廣的 AlphaGo 更像是一場大型 PR 活動以推廣它的計算平台,而正在測試中的自動駕駛汽車我報以很樂觀的態度,可能在幾年後就可以真是地出現在我們的生活中。
SenseTime 是一個解決方案公司?其商業化的付費方式是單次付費、流量付費、調用介面付費?還是可以買斷?
曹旭東:我們希望不斷提升 SenseTime 的 Net 的能力並用更好的深度學習技術來服務人們的需求,因此我們更希望以合作的太多和各個公司一起讓他們已經擁有的海量數據變得有價值。同時,這些海量數據所優化出來的系統也會有更大的價值。至於付費方式,請和 SenseTime 的商務聯繫。
當然,活動之後大家還對 Deep Learning 技術及相關的學習工作等話題展開了討論,並且有好吃的東東 !
稀土Meetup 同樣會在五月給大家帶來同樣精彩的專業技術分享,相關信息請大家訪問 Meetup 主頁或是關注我們的公眾號「稀土圈」。
推薦閱讀:
※【乾貨】Kaggle 數據挖掘比賽經驗分享
※數據分析師什麼時候能不寫SQL了?
※數據研究所:「妖怪」屬性卡製作手冊——LPL全上單全屬性綜述
※和車品覺聊數據的本質