TensorFlow會成為Google在AI時代的新「安卓系統」嗎?

文 | 周小丹

在谷歌位於矽谷的園區里,一座被命名為 1965 的低矮的辦公樓坐落在離 101 高速路出口最近的區域。單從地圖上看,想驅車前往這座不起眼的建築並不方便。過去幾十年里,每天穿梭在這條高速上的山景城居民早已經對矽谷發生的那些「改變世界」的公司和產品故事習以為常,這座矮樓當然也常常被習慣性的忽略。

但這裡是谷歌大腦的所在地。現在,當人們對未來充滿恐懼、談論起人工智慧是否會取代人類、機器和人的關係該是如何時,至少該先看看發生在這裡的近況——作為當下一輪機器學習和神經網路熱潮的第一批擁躉,谷歌大腦已經取得了一些標誌性的成就。

谷歌正在圍繞著 AI 重建公司,機器學習現在則成為了這家巨頭包括廣告、無人駕駛等重要項目的主要技術驅動力。而無論從谷歌一貫打造開放平台的「傳統」來說,還是從商業化上的考量,將機器學習的成果開放給更多開發者,幾乎和用這些成果改造自家產品是同樣重要的問題——這一步決定了谷歌能不能在這個近乎處於蠻荒狀態的 AI 時代儘早建立生態。從一定程度上來說,2015 年穀歌發布的機器學習開發平台 TensorFlow 擔負了這樣的使命。

2015 年,在將 TensorFlow 正式開源時,Google CEO Sundar Pichai 曾經在公開 blog 里寫到:「我們內部已經看到這個工具能夠提供非常強的能力,並且希望把機器學習的能力開放給更多的企業和個人開發者。」兩年後,TensorFlow 已經成為 GitHub 上最受開發者歡迎的工具。遠超由微軟、Facebook 等公司提供的計算框架。

谷歌大腦的工程師們很願意把 TensorFlow 的故事與安卓的誕生和意義做類比,並且津津樂道。後者是幫助 Google 完成桌面時代向移動時代轉型的關鍵一躍。

TensorFlow 能輸出谷歌的 AI 服務,並且幫助谷歌再完成一次「生態建立」的使命么?

這對正走向 AI first 的 Google,將是一個關鍵問題。

搶佔高地

TensorFlow 的誕生和開源的過程,既符合 Google 一貫堅持開源、消除信息死角的傳統和使命,又代表著這家公司在下一個十年的野心。

2011 年,四位 Google Fellow 之一、MapReduce 和 BigTable 的發明者 Jeff Dean 和當時的斯坦福計算機科學家吳恩達共同創辦了 Google Brain,專註於用神經網路的方法研究人工智慧。一年之後,這個最初建立在 Google X 中的項目脫穎而出,成為更高一個層級的研究機構。

(Google Brain的領軍人物Jeff Dean,他曾經發明 MapReduce 和 BigTable)

在 Google Brain,每一個工程師都能對這個部門的使命脫口而出:讓機器更智能,以提升人類生活質量。利用深度學習技術,計算機將一定程度上模擬人類大腦神經元的工作模式,建立學習機制。這也意味著這項技術發展到一定程度上,人們不再需要依據規則的系統進行人工智慧在各個領域的開發,機器也不再需要提取語音、文字、圖像等各個領域的特徵,它可以自己通過訓練達到目標。

而就是在基於神經網路的深度學習開發過程中,研發團隊開發了一個名為 DistBelief 的深度學習技術框架,這個名稱是「disbelieve"的諧音,代表著這是一個在技術和潛力上都「簡直不可思議」的計算框架。但當時的 DistBelief 要在 16000 台計算機的計算基礎上才能運行,過程非常複雜。Google Brain 團隊對這個框架進行了簡化,讓它變得非常靈活,能夠輕鬆運行在個人計算機或者單個或多個 CPU 和 GPU,甚至移動設備上——這成為了如今我們所熟知的 TensorFlow。

在 2015 年,Google 正式開源了 TensorFlow。這是擅長從事長期研究的 Google Brain 成立幾年以來,唯一一個對外發布的產品。事實上,最初發布的版本也並不完美。但 Google 的工程師們顯然有著更長遠的考慮。

一方面,Google Brain 團隊在最近幾年已經強烈意識到,有時產品落地比發表更多的論文更加重要。更何況,Google 曾經也經歷過「為他人做嫁衣」的教訓。2003 年,Google 公布了關於 GFS、MapReduce 和 BigTable 三篇技術論文,它們成為雲計算髮展的「三駕馬車」,Google 內部曾經為此歡欣鼓舞。但幾年後,MapReduce 則由 Apache 基金會率先開發成分散式系統的基礎構架 Hadoop,並開給外界使用並且獲得廣泛應用,自那以後,在開發者的認知中,Hadoop 竟然成為了 MapReduce 的「發明者」。

此事曾讓 Google 的工程師們十分受挫。所以這一次,Google Brain 不再只把相關成果以論文方式發表在學術起開上,同時決定把相關源代碼以 TensorFlow 的方式「一步到位」的開放給工業界。

另一方面,儘管 TensorFlow 本身沒有任何商業盈利的計劃,但它可以成為 Google Cloud 在商業推廣上的重要推動力。在 2015 年,在開源 TensorFlow 以後,Google 很快公布了 GoogleCloud ML 服務。這意味著,基於 TensorFlow 生態鏈的、服務多個大規模計算領域的神經網路(比如 Alpha Go)就會成為 Google cloud 推行「AI 即服務」的殺手鐧。

或許就是來源於技術方面的自信,Google 雲平台業務的負責人黛安·格林在今年曾經非常樂觀的預測,因為有來自人工智慧方面的加持,Google cloud 的市場份額將在五年後躍居市場第一。

一個人工智慧時代的安卓生態?

就連在 GoogleBrain 工作的工程師都認為,從路徑和目標來看,TensorFlow 的開源有著安卓生態故事的影子。

在 Google,一直都有著非常濃厚的開源基因。目前它旗下已經有超過 60 個開源的項目。開源甚至成為了這家公司商業模式的重要組成部分,而安卓的成功讓它對這一點更加認同。

進入移動互聯網時代後,Google 在 iPhone 大賣後立刻加速了安卓的發布,並且在接下來的時間裡不斷更新版本,讓這個系統在低價手機和高端手機上都能實現完好的適配。這一步基本幫助不擅長硬體的 Google 完成了移動優先的戰略轉型,防禦甚至反擊了蘋果 iOS 在移動時代的強勢進攻。到現在,安卓已然成為 Google 的一個標準平台。

時至今日,Android 身影幾乎無所不在。但安卓系統的演進也經歷了先求有、再求優的過程。而也正是因為開源,才讓谷歌吸引了大量第三方合作夥伴和人才的參與,才建立起了在移動時代的生態系統。

(安卓生態的成功,讓Google更加相信開源的力量)

Google 一直堅信,能夠獲得用戶的信息和長效依賴,這比用戶一時的消費有價值多了。所以在 Google 喊出 AI first 的口號後,開源一個促進機器學習研究和企業應用產品對接的平台,意義不言自明:它有望幫助 Google 構建機器學習領域的產業標準,也能大大降低深度學習在各個行業中的應用難度。使用 TensorFlow 進進行機器學習領域的研究和應用的人越多,就越容易讓谷歌在人工智慧領域獲的主導權。

但結合軟體和硬體等方式將 AI 能力開放並輸出,這已經是屬於科技巨頭的兵家必爭之地。包括微軟、百度和 Facebook 都開放了提供基礎路線圖的深度學習工具,甚至在 9 月 11 日,Facebook 和微軟決定聯手開發一個允許人工智慧開發者在 Caffe2、Cognitive Toolkit 和 PyTorch 框架下自由互通的格式,該項目被稱為 ONNX。

這一步棋,被人們視為 Facebook 和微軟兩家巨頭聯手對抗 TensorFlow 而為之。

但單從人工智慧服務的輸出布局上來看,Google 幾乎完全不用擔心:在深度學習的生態方面,Google 結合從雲到 TPU 再到 TensorFlow 的整體服務矩陣的組合邏輯似乎已經更加完整:TensorFlow 的基礎框架和 TPU 的計算能力現在都可以通過 Google cloud 向外輸出;在這背後,則是 Google Brain 一刻也不會停歇的基礎研究和正在研發中的量子計算。

如果人們曾經認為軟體會吞噬世界,那麼現在,Google 有了更大的胃口。從這個角度上來說,TensorFlow 和它背後這套 Google 的人工智慧「組合拳」,似乎在為一個比移動時代更有「張力」的未來做準備。

AI 即服務:這是未來的方向么?

不過,TensorFlow 本質上還是一個比較底層的框架,它更適合大規模的調度,但也因此常常被工業界吐槽不能滿足很多個性化需求,導致不少運行在 TensorFlow 上的具體項目在商業化落地過程過於緩慢。

在知乎上,出門問問 NLP 工程師李理就撰文分析過:「TensorFlow 有意義,但又不是神乎其神的東西……因為在工程界里,若要完成一整件事,如識別語音,TensorFlow 這種通用深度學習框架的存在更多是錦上添花,而非決定根本。」

就拿 TensorFlow 和百度推出的深度學習框架 PaddlePaddle 相比來看,後者似乎更加「務實」,它不僅將源代碼開放,而且直接為開發者提供了很多整體解決方案,為開發者提供了快速實現商業化落地的路徑。對於這個開放社區來說,百度介入的更深,也表現的更加心急。

不過這本質上指向的是一個關鍵問題:在技術越來越走向開源的今天,國內科技巨頭們正在推崇的「AI as a service」是否是個真正成立的商業命題?

(越來越多的科技巨頭,喊出了「AI 即服務的口號)

例如,目前騰訊雲搭建的卷積神經網路模型, 已經可以讓開發者利用 TensorFlow 實現基於 CNN 數字識別的代碼;而阿里雲推出的 GN5i 也可以一鍵部署 TensorFlow、caffe 等主流深度學習框架,並且在這個基礎上對接了更多開發者的具體需求。

選擇這些服務當然會讓開發者更加「省心」,即便不能滿足開發者 100% 的需求,也能讓他們在 90% 的基礎上繼續開發。但另一方面,選擇某一家雲計算的服務,也就意味著需要在前期與巨頭的設備進行綁定。對中小型創業公司來說可以減少成本,但對不少「有野心」的創業公司來說,這算不上是一個簡單的決定。

同時,從另一個角度來說,在未來當 AI 成為一種「普惠」、「民主」的基礎能力後,出售 AI 服務的商業價值和想像力還有多大?

當我們把這個問題拋給 Google 時,Google 的工程師們坦承的表示,在 Google Brain 內部對這個問題也有過爭論。但目前 TensorFlow 依然採取了比較「保守」的戰略:提供更多個性化服務當然可以讓平台離商業化更近一步,但當下,依然是不斷完善這個社區的基礎能力,並且期待開發者能為它帶來更多突破——更何況,就連 Dean 自己也預言,想要實現通用型人工智慧,大概還需要至少 15 到 50 年的時間。

所以目前 TensorFlow 選擇只開源代碼,並在運營社區時把更多時間花在了和開發者溝通並且教授專業知識的工作上,以便更多的 Google 員工和 Google 外部人員可以幫助到這個社區。

但包括谷歌在內的許多工程師還在向著通用人工智慧這個遠大的方向進行長時間的研究。而那些利用開放框架運行的項目和大量數據也能反哺和加速這個過程。

目前 Google Brain 已經把機器翻譯、圖像分析、醫療、機器人等幾個領域作為深度學習重點研究的方向,並且尋找通用的解決方案。比如在醫療影像中,深度學習已經可以使用視網膜影像進行糖尿病的診斷。不過張坤也坦言,這些領域或許不是最「火」的,但卻在 Google 的能力範圍內。Google的工程師向我們表示:「接下來更近要的是看業界將如何利用 Google 開放的這些能力,也許他們會給整個人工智慧在解決實際問題的過程中帶來驚喜。」

TensorFlow 已經擁有了超過 500 位代碼貢獻者,從發布至今,一共有超過 12000 次的代碼提交和超過 100 萬次的代碼庫下載。「我們很幸運有機會能與這麼多的外部開發人員進行互動,希望對其中的一些人產生積極的影響,並且幫助他們創造基於機器學習的新應用程序。」GoogleBrain 的一位工程師頗有自信的說,「現在我們只需要把事情做好,那麼很多數據自然會聚集過來。」

那麼,TensorFlow 會成為 AI 時代的新安卓系統么?或許從現在 TensorFlow 業務設置的架構和影響力上,我們還很難給出這樣的定義。但這個帶有些許「公益」性質的開源工具需要依託更多人和數據的參與才能繼續延伸能力,它為 Google 未來在 AI 布局上帶來的基礎優勢還是顯而易見的。

更何況,跳出業務和商業計劃,這個機器學習時代更具有普適性的「工具」體現的,仍然是 Google 堅持多年「持續開放」、「消除信息死角」的價值觀,和它最終期待建立的「AI 民主化」未來。

aHR0cDovL3dlaXhpbi5xcS5jb20vci9rRHRXVGpmRUVtcHRyWE10OTI2Qw== (二維碼自動識別)

這是極客公園前沿社超頻之旅的系列文章之一。今年九月,我們與國內優秀創業公司的管理者一起走進了矽谷,和 Google、Facebook 以及多個前沿科技公司進行了深度交流。現在,我們選擇了這趟旅途中最有價值的思考想和你一起分享,請持續關注前沿社和頂樓帶來的後續報道。

頂樓 TopView 是極客公園前沿社的特別內容生產小組,我們關注前沿科技對現在及未來商業所帶來的影響,發表最具科技的商業洞見。

原文鏈接 → 只為商業新變數


推薦閱讀:

神經網路中權值和鏈接的修剪(一)
【信息匯總】國際「頂尖」計算機視覺、機器學習會議大搜羅--附排名&接收率
《得意忘形》播客 #19:下圍棋的人工智慧與人類的永恆自戀
知識圖譜從0級到10級簡化版
營銷迎來下一個拐點,人工智慧可以找回浪費的那一半廣告費嗎?

TAG:TensorFlow | 谷歌Google | 人工智能 |