谷歌TPU 3.0重磅發布;I/O大會上機器人真的能打Call!

谷歌TPU 3.0重磅發布;I/O大會上機器人真的能打Call!

5 人贊了文章

谷歌I/O大會終於來了。今天的大會上,谷歌有三個值得業界關注的新產品發布:TPU3.0、能讓機器人打電話的Google DuplexAndroid P。今年穀歌I/O大會,全場都在談AI,谷歌的AI First戰略已經深入到每個產品中。

跟去年一樣,7000人來到了谷歌I/O開發者大會現場。

Pichai上場。

Pichai先是講了谷歌「核心」產品中最大的問題:emoji中的偷工減料問題,比如,漢堡和啤酒表情。

最後它們解決了這兩個讓人不爽的問題。Pichai只是開玩笑,其實在技術大爆炸的時代,谷歌有更多責任去減少數字鴻溝、承擔更多社會責任,而AI提供了一種解決社會問題的途徑。

Pichai舉了三個AI應用到現實社會中的例子。

第一個例子:AI應用於醫療。

使用深度學習分析視網膜圖像,以此預測心血管疾病突發的風險。

谷歌通過在來自284335名患者數據上訓練的深度學習演算法,能夠從12026名和999名患者的兩個獨立數據集中患者的視網膜圖像,以驚人的高準確度預測病人的心血管疾病風險因子。例如,演算法通過視網膜圖像區分吸煙者與不吸煙者的準確率有71%。

左圖:眼球背部圖像顯示斑疹(中間的黑點),視盤(右側亮點)和血管(右側亮點旁的深紅線)。右圖:視網膜圖像呈灰色,使用了深度學習演算法的像素可以預測血壓(綠色陰影高亮顯示)。我們發現每個心血管風險因子預測使用不同模式,例如血管用於血壓,視盤用於其他預測。

(詳細內容見新智元的報道)

在Pichai演講的同時,Google AI也公布了谷歌與斯坦福大學醫學院等合作的研究成果「用於電子健康記錄的可擴展、準確的深度學習」。

論文地址:

nature.com/articles/s41

圖:病人記錄中的數據以時間線的形式表示。

研究人員設計了一個計算機系統來進行預測,而無需為每項任務手動製作新的數據集,並且可以採用可擴展的方式。但構建數據只是工作的一部分; 預測還需要準確。

評估準確性的最常見方法是接收者操作特徵曲線(ROC曲線),該曲線衡量模型如何區分具有特定未來結果的患者與不具有特定未來結果的患者之間的區別。在這個度量標準中,1.00表示完美,0.50表示不比隨機結果好,因此數字越高意味著模型越準確。谷歌報告的模型預測患者是否會住院的得分為0.86(傳統邏輯回歸方法得分為0.76); 在預測住院死亡率方面得分為0.95(傳統方法為0.86),在預測出院後意外再住院率方面得分為0.77(傳統方法為0.70)。

這些模型也被用來評估患者接受治療的條件。例如,如果醫生為患有高溫,發熱和咳嗽的患者開具頭孢曲松和強力黴素,則該模型可以將這些標識為患者正在接受肺炎治療的信號。

該研究的一個重點是深度學習模型的可解釋性。

圖:在患者入院後24小時使用深度學習模型進行預測。

這對患者和臨床醫生意味著什麼呢?機器學習可用於改善醫療,這項工作是一個開始。

Pichai說,AI可以影響的最大的領域是醫療

第二個例子:聲畫分離

當人們在電視上互相交談時,字幕就會很糟糕。谷歌試圖用AI解決問題。

谷歌用一種深度學習音頻-視覺模型,用於將單個語音信號與背景雜訊、其他人聲等混合聲音分離開。例如,AI可以通過YouTube幫助谷歌識別誰在說話,即使是在一場爭吵比賽中,自動生成字幕。

Pichai說,辯論很好,大喊大叫不好。我希望谷歌能解決人們在電視上互相吼叫的問題。

第三個例子:Gboard。

Pichai介紹了谷歌的輸入法Gboard的功能:添加了摩爾斯電碼。

谷歌展示了開發者Tania Finlayson的視頻。由於疾病,Tania Finlayson無法通過自然聲音與其他人交流。視頻中,Tania Finlayson通過摩爾斯電碼發出了聲音。

通過頭戴的定製設備,可以分析她的頭部的動作並將其轉碼為摩爾斯電碼。當她觸發左鍵時,該設備會添加一個簡訊號,而右鍵則會觸發一個長信號。接著,設備將文本轉換為語音。

谷歌的Gboard用兩個區域代表簡訊號和長信號。鍵盤上方有多個單詞建議,就像普通鍵盤上的一樣。目前,Gboard已經在iOS和Android上提供測試版。Tania也來到了I/O大會現場,受到了大家的熱烈歡迎。

谷歌一直在用AI帶來改變。

比如Gmail的新功能,這個功能被稱為智能組合

簡而言之就是在你輸入文字後,谷歌使用機器學習推薦你可能輸入的短語。你所要做的就是按Tab鍵。

Pichai說,它負責處理日常事務,比如地址。「(使用了新功能後)我給公司發了更多的郵件。」

本月晚些時候,所有Gmail用戶都將使用智能組合。

接下來是Google Photo。Pichai說,在谷歌的照片中,每天都有超過50億張照片被觀看。它也融入AI技術,比如自動修正亮度。

同時,在谷歌照片中,名為Smart Actions的新智能功能將會識別照片中的人物,比如照片中如果有Lisa,可以把其中關於Lisa的照片發給她。

另外,如果照片曝光不足,在谷歌照片中的人工智慧將提供一個建議來修復亮度。谷歌照片可以使用人工智慧將照片中的主體分離出來,並在顏色上重新創建一個灰度照片。

並且能夠對舊照片著色,這是一個非常有趣的圖像識別應用(國內騰訊AI Lab也做過類似的技術)。

最後是文檔轉換功能,Google Photo能識別文檔並將其轉換為PDF。這對工作人士非常有幫助。

第一個重磅產品:TPU 3.0,性能是TPU2.0的八倍

接下來,Pichai講到了重磅部分——TPU 3.0

Pichai說,3.0的能力是去年晶元的8倍,性能達到100 petaflops。「這些晶元如此強大,以至於我們第一次不得不在我們的數據中心用上了冷卻液。」

作個比較,一個包含16個英偉達最新版GPU的晶元組能夠提供的計算能力是2 petaflops。

TPU(張量處理器)是谷歌為機器學習定製的專用晶元,專為谷歌的深度學習框架TensorFlow而設計。

谷歌在2016年的I/O大會上首次公布TPU。不過在此之前 TPU已在 Google 內部的一些項目中使用了一年多,如 Google 街景服務、 DeepMind的AlphaGo 等都用到了 TPU。

在去年的I/O大會上,谷歌發布了第二代TPU。第二代 TPU 設備單個的性能就能提供高達 180 teraflops 的浮點運算能力。不僅如此,谷歌還將這些升級版的 TPU 集成在一起成為 Cloud TPU。每個 TPU 都包含了一個定製的高速網路,構成了一個谷歌稱之為 「TPU pod」 的機器學習超級計算機。一個 TPU pod 包含 64 個第二代 TPU,最高可提供多達 11.5 petaflops。

Pichai說,谷歌公司第一次不得不在其數據中心採用液體冷卻——液體冷卻通常用於高性能計算晶元或PC中的一些性能導向的晶元。

值得一提的是,在隨後Waymo CEO上台介紹谷歌自動駕駛取得的新進展時,特彆強調Waymo自動駕駛系統使用TPU,將性能提高了15倍

幾乎所有大公司都在開發自己的AI定製晶元,這一領域競爭激烈。Facebook的硬體針對其Caffe2框架進行了優化,該框架旨在處理其對用戶的大量信息圖。亞馬遜試圖通過AWS構建雲基礎架構的生態系統。微軟則押注比定製晶元更靈活的FPGA,在昨天BUILD大會上公布Project Brainwave,其性能可與定製晶元相媲美,並且實時 AI 能力延遲相比TPU低 5 倍。

Google Duplex:完美與人類溝通,讓機器人為你打Call

接下來應該是本次大會的明星產品——Google Assistant

Google Assistant用到了DeepMind的WaveNet技術,並且能夠模擬6個人的聲音,而且這六個人的聲音聽起來相當自然。每個人的聲音都有完全不同的效果。

其中還包括歌手John legend的聲音。

Google Assistant的更詳細的功能交給負責人Scott Huffman介紹。總結有四大亮點:

連續對話

以前喚醒Google Assistant每次都要說「Hey Google」或「OK Google」等熱門辭彙,現在可以進行更自然的談話,而無需在每次帶助手的句子後觸發命令,並且還可以區分何時與其通話或與其他人交談。Scott Huffman介紹,這個功能將在「未來幾周」推出。

多個操作

Google的虛擬助理可以在同一個語音命令中執行同時操作,使用協調減少功能即使使用更長的命令也能準確找出用戶的含義。例如,用戶可以要求它設置提醒並在一條語音消息中播放。

Pretty Please

有點像亞馬遜對最近推出的Echo Dot兒童版一樣,谷歌助理添加了一些技巧,為用戶(特別是孩子)提供了積極的支持。

當孩子們與助理通過禮貌的詞語(如Please和Thank You)交談時,助理會表揚孩子有禮貌,並且還提供免費的適合家庭的內容,包括Google合作夥伴(如迪士尼)的遊戲、活動和故事。

Google Duplex

今晚最大的亮點之一就是Google Duplex。

它不僅能夠像一般的助理一樣安排日程,更重要的是能夠以極為類似人聲的角色為你操作接下來的行動!

左邊是機器人,右邊是真人

Pichai演示了為髮型設計師助理安排預約餐廳的案例,在視頻中,谷歌助理記錄下了需求,並真!的!給餐廳打!電!話!了!

Pichai說,機器人打電話的過程是實時的,不是表演的。而餐廳服務員與這個機器人交流完全沒有障礙。

這個功能將來會上線。

智能化的Android P

第三個是重要部分是Android P。

Android P有三大特性智能、簡潔、Digital wellbeing,其中第一個也是最重要的一個是智能。

智能體現在以下幾個方面:

智能適應電池功能。谷歌與DeepMind合作開發了一項名為「自適應電池」的新功能,利用AI來檢查用戶如何使用手機,並尋找方法來減緩耗電。

具體來說,該功能使用AI來預測用戶接下來會使用那些App,以及那些App只會偶爾被打開一下。Android P將不經常使用APP會進入睡眠狀態。谷歌表示,這能讓App的喚醒次數平均減少30%,得以延長手機的電池續航時間。

智能亮度調節。Android P還通過「自適應亮度」的功能來節省電池壽命。該功能可以根據用戶的使用習慣來控制手機屏幕的亮度。例如,如果是白天,手機會自動降低屏幕亮度以節省電量。

自適應電池和自適應亮度兩項功能都由DeepMind與谷歌Android團隊合作開發。

智能識別用戶活動。將最常用或即將使用的應用提前,為用戶智能推薦應用。

Slices。在Google搜索中輸入相關辭彙,如果涉及到手機上的應用,就會出現該應用的相關功能。比如輸入Lyft,就會在搜索結果中看到一個應用程序slice,用戶可以直接從該頁面使用應用功能(類似搜索里的直達號?)

MLKit API介面。第三方App也能即時使用AI模板。

其他產品:地圖、媒體、自動駕駛等全部AI化

I/O大會,其實是全面展示Google產品的大會,包括地圖、媒體、自動駕駛(Waymo)等。

比如說Google News

在News首頁,谷歌為提供的五個Top新聞,這是全球頭條新聞、本地新聞和你一直關注的新聞的最新動態。

然後,你可以切換到標題,看世界各地的頭條新聞。這裡的附加部分讓你深入到不同的主題,如體育、商業或技術。

谷歌推出了一種新的視覺形式叫newscast,它使用自然語言理解提供一個單一主題的文章、視頻和引用。這可以讓你在短時間內通過瀏覽不同的源來獲得一個事件的基本信息,這樣你就可以決定是否要進繼續看一個新聞。

如果你想深入到一個特定的話題,谷歌新聞的「Full Coverage」功能可以讓你看到一個新聞是如何從不同的地方和多種形式出現的,如社會評論、地方新聞來源、和頂級出版商的報道。谷歌新聞將收集如何實時地討論和發布新聞,並將它們聚集在一個地方。

自動駕駛方面,Waymo的CEO也上台演講,現在,Waymo是世界唯一一個有在公共道路上路的Fully Selfdriving Car的公司,已經有超過600萬英里的行駛記錄。

前文提到,Waymo自動駕駛系統使用TPU,將性能提高了15倍,而使用深度學習也讓Waymo自動駕駛有了對比:(上圖是使用前,下圖是使用後)

至此,谷歌2018I/O大會到此結束,你覺得哪項產品能改變未來?

(本文首發於新智元微信公眾號:AI_era,歡迎關注!)


推薦閱讀:

用頂尖的N個會話式聊天開發平台建立自己的會話機器人 , 2017
ROS機器人實例 —— Universal Robots
選購工業機器人力矩感測器的五大黃金法則
揭秘日本現代機器人教父石黑浩:20年專做美女機器人
中央十套《我愛發明》首次全面介紹教育機器人,推薦學機器人的孩子和家長一定要看。

TAG:機器人 | 科技 | 谷歌Google |