AI演算法眼中的世界是什麼樣子?這些圖像或許能幫你更好地理解

人工智慧領域近幾年正在突飛猛進地發展,尤其是被擁有大量用戶數據和計算能力的大公司控制的機器學習演算法。現在,這些演算法形成一股無形的力量,不斷深入地影響著我們生活的方方面面,從自動駕駛,到語音助手,到區塊鏈…… WIRED 連線雜誌每年年終都會對下一年裡可能影響我們生活的技術進行盤點。17年最後一期的 WIRED World 2018 專題中,就提到了與人工智慧演算法相關的幾項技術。

來自倫敦的藝術與科技工作室 FIELD 為 WIRED 雜誌創作了圖片和視頻,將這些演算法黑科技視覺化,用圖像幫助我們理解這些抽象的計算機語言和代碼邏輯。FIELD 工作室的創意總監 Marcus Wendt 說:這些在我們生活中出現的新技術非常抽象,缺乏直觀的視覺形象,人們很難理解這種抽象的東西。沒有任何東西可以幫助我們決定是否可以信任這些系統,以及當出現多個可選時應該選擇哪一個。

因此,FIELD 通過圖像創作為演算法開發了一種新的視覺語言,讓它們更加平易近人。我們可以通過這些圖片和視頻,更好地理解機器學習演算法的各種應用,包括語音助手、區塊鏈、自動駕駛、人臉合成、圖像創作等。

№1

下一代語音助手

像 Alexa、Siri、Cortana 這樣的AI語音助手將在2018年變得更加聰明。一個名為「動態程序生成 (Dynamic program generation) 」的新技術能讓它們理解更為複雜的指令,甚至是指令背後的意圖。它們還可以利用你在設備上使用的所有應用程序的功能和數據進行響應。

這張圖片展示的是自然語言處理演算法 SyntaxNet,我們可以看到最底層是聲波形式的聲音輸入。它被解析為音素,隨後通過多個動態排列組合的處理過程,最後提取出用戶的請求並給出響應。

https://www.zhihu.com/video/944882034838056960

№2

追蹤貨幣交易

數字貨幣一開始發行就吸引了大量注意力,不少政府也在測試自己的加密數字貨幣,數字貨幣在2018將會繼續擴大影響力。

這張圖片描述的是以太坊 (Ethereum) 的交易,以太坊是一個開源的去中心化區塊鏈應用平台。每個方塊代表組成區塊鏈的分散式賬本中的一行,方塊的顏色由正在轉移的金額決定。

https://www.zhihu.com/video/944882180745355264

№3

從自動駕駛的視角看世界

為了能在道路上安全行駛,自動駕駛汽車需要感知周圍的環境。要做到這一點,就需要一套演算法來集成大量感測器反饋的實時信息,包括視頻、紅外、雷達、超聲波等多種類型。通過之前的機器學習,演算法將這些數據進行多達150個階段的加工和篩選,生成實時的環境模型。

這個可視化圖像是基於谷歌的圖像識別系統 Inception 建立的,從圖上可以看到,輸入的數據(圖片右側)被拉到左上方進行處理,生成前方路況的模型。

https://www.zhihu.com/video/944882302858309632

№4

人臉合成

2017年,華盛頓大學的研究人員通過對奧巴馬總統的公開演講進行深度學習,僅利用一段音頻資料就可以偽造出可信度極高的奧巴馬演講視頻,嘴唇的同步幾乎是完美的。如果這個技術被濫用,結果將多麼可怕,我們還會繼續信任自己從鏡頭中看到的影像嗎?

這個運用眾多軟體模塊生成奧巴馬臉部的圖像,展示了演算法如何通過學習聲音與面部活動之間的關係,處理不同聲音下嘴唇、眼睛、臉頰等部位的細微變化。

https://www.zhihu.com/video/944882428163194880

№5

圖像創作

通常,演算法通過接收人類的反饋來做出改進。現在,有一種之前被認為不可能的非監督式學習方法——生成對抗網路 (Generative Adversarial Network,簡稱GAN) 誕生了。這個方法通過兩個機器學習程序相互對抗進行提升,一個負責生成以假亂真的事物,一個負責判別生成事物的真假。

Amazon 正在測試一個應用程序,可以分析圖片後,創作出相似的圖片。雖然它現在只能用來創作小圖片,但有一天這種技術會被用來創作電影、三維物體模型等。

https://www.zhihu.com/video/944882526456594432

? THE END ?

蘑菇

編譯自field.io


推薦閱讀:

常見的深度學習模型--卷積神經網路概述
人工智慧——狀態機
Character人物之線條表現
未來政治制度是一個「演算法」制度
SKlearn機器學習入門(5決策樹(分類))

TAG:人工智慧演算法 | 機器學習 | 可視化 |