快來看,一個用於人工智慧的開源神器

關於 TensorFlow

TensorFlow? 是一個採用數據流圖(data flow graphs),用於數值計算的開源軟體庫。節點(Nodes)在圖中表示數學操作,圖中的線(edges)則表示在節點間相互聯繫的多維數據數組,即張量(tensor)。它靈活的架構讓你可以在多種平台上展開計算,例如台式計算機中的一個或多個CPU(或GPU),伺服器,移動設備等等。TensorFlow 最初由Google大腦小組(隸屬於Google機器智能研究機構)的研究員和工程師們開發出來,用於機器學習和深度神經網路方面的研究,但這個系統的通用性使其也可廣泛用於其他計算領域。

什麼是數據流圖(Data Flow Graph)?

數據流圖用「結點」(nodes)和「線」(edges)的有向圖來描述數學計算。「節點」 一般用來表示施加的數學操作,但也可以表示數據輸入(feed in)的起點/輸出(push out)的終點,或者是讀取/寫入持久變數(persistent variable)的終點。「線」表示「節點」之間的輸入/輸出關係。這些數據「線」可以輸運「size可動態調整」的多維數據數組,即「張量」(tensor)。張量從圖中流過的直觀圖像是這個工具取名為「Tensorflow」的原因。一旦輸入端的所有張量準備好,節點將被分配到各種計算設備完成非同步並行地執行運算。

TensorFlow的特徵

高度的靈活性

TensorFlow 不是一個嚴格的「神經網路」庫。只要你可以將你的計算表示為一個數據流圖,你就可以使用Tensorflow。你來構建圖,描寫驅動計算的內部循環。我們提供了有用的工具來幫助你組裝「子圖」(常用於神經網路),當然用戶也可以自己在Tensorflow基礎上寫自己的「上層庫」。定義順手好用的新複合操作和寫一個python函數一樣容易,而且也不用擔心性能損耗。當然萬一你發現找不到想要的底層數據操作,你也可以自己寫一點c++代碼來豐富底層的操作。

真正的可移植性

Tensorflow 在CPU和GPU上運行,比如說可以運行在台式機、伺服器、手機移動設備等等。想要在沒有特殊硬體的前提下,在你的筆記本上跑一下機器學習的新想法?Tensorflow可以辦到這點。準備將你的訓練模型在多個CPU上規模化運算,又不想修改代碼?Tensorflow可以辦到這點。想要將你的訓練好的模型作為產品的一部分用到手機app里?Tensorflow可以辦到這點。你改變主意了,想要將你的模型作為雲端服務運行在自己的伺服器上,或者運行在Docker容器里?Tensorfow也能辦到。Tensorflow就是這麼拽 :)

將科研和產品聯繫在一起

過去如果要將科研中的機器學習想法用到產品中,需要大量的代碼重寫工作。那樣的日子一去不復返了!在Google,科學家用Tensorflow嘗試新的演算法,產品團隊則用Tensorflow來訓練和使用計算模型,並直接提供給在線用戶。使用Tensorflow可以讓應用型研究者將想法迅速運用到產品中,也可以讓學術性研究者更直接地彼此分享代碼,從而提高科研產出率。

自動求微分

基於梯度的機器學習演算法會受益於Tensorflow自動求微分的能力。作為Tensorflow用戶,你只需要定義預測模型的結構,將這個結構和目標函數(objective function)結合在一起,並添加數據,Tensorflow將自動為你計算相關的微分導數。計算某個變數相對於其他變數的導數僅僅是通過擴展你的圖來完成的,所以你能一直清楚看到究竟在發生什麼。

多語言支持

Tensorflow 有一個合理的c++使用界面,也有一個易用的python使用界面來構建和執行你的graphs。你可以直接寫python/c++程序,也可以用互動式的ipython界面來用Tensorflow嘗試些想法,它可以幫你將筆記、代碼、可視化等有條理地歸置好。當然這僅僅是個起點——我們希望能鼓勵你創造自己最喜歡的語言界面,比如Go,Java,Lua,Javascript,或者是R

性能最優化

比如說你又一個32個CPU內核、4個GPU顯卡的工作站,想要將你工作站的計算潛能全發揮出來?由於Tensorflow 給予了線程、隊列、非同步操作等以最佳的支持,Tensorflow 讓你可以將你手邊硬體的計算潛能全部發揮出來。你可以自由地將Tensorflow圖中的計算元素分配到不同設備上,Tensorflow可以幫你管理好這些不同副本。

誰可以用 TensorFlow?

任何人都可以用Tensorflow。學生、研究員、愛好者、極客、工程師、開發者、發明家、創業者等等都可以在Apache 2.0 開源協議下使用Tensorflow。

Tensorflow 還沒竣工,它需要被進一步擴展和上層建構。我們剛發布了源代碼的最初版本,並且將持續完善它。我們希望大家通過直接向源代碼貢獻,或者提供反饋,來建立一個活躍的開源社區,以推動這個代碼庫的未來發展。

既然這麼屌,為啥Google要開源這個神器?

如果Tensorflow這麼好,為啥不藏起來而是要開源呢?答案或許比你想像的簡單:我們認為機器學習是未來新產品和新技術的一個關鍵部分。在這一個領域的研究是全球性的,並且發展很快,卻缺少一個標準化的工具。

通過分享這個我們認為是世界上最好的機器學習工具庫之一的東東,我們希望能夠創造一個開放的標準,來促進交流研究想法和將機器學習演算法產品化。Google的工程師們確實在用它來提供用戶直接在用的產品和服務,而Google的研究團隊也將在他們的許多科研文章中分享他們對Tensorflow的使用。

本文由「猿助猿」發布,2017年04月05日

推薦閱讀:

TensorFlow基於Python在windows系統中的安裝
TensorFlow小試牛刀(1):CNN圖像分類
CS224n異聞錄(二)
TensorFlow中的一些細節
機器學習中的HelloWorld

TAG:人工智慧 | TensorFlow |