蘋果開發者大會WWDC 2017:首次全面展示蘋果的人工智慧實力
當地時間 6 月 5 日,蘋果開發者年度盛會 WWDC 2017 在美國加州舉行。在這個舞台上,我們看到了蘋果今年在軟體、硬體上的升級和新發展。在今年的 Keynote 中,我們看到了蘋果不同於谷歌、Facebook 的人工智慧戰略。
2016 年 8 月份,Backchannel 的一篇文章正式揭開了蘋果公司人工智慧研究的面紗。雖然蘋果是第一家將智能助理(Siri)整合進其操作系統的主流公司,但它一直不像谷歌、Facebook 那樣大肆渲染自己的人工智慧技術,也沒有專門的組織和團隊進行人工智慧的研究。
在 Backchannel 的報道中,軟體主管兼高級副總裁 Craig Federighi 曾表示,「在蘋果,我們並沒有一個單獨集中負責機器學習技術的組織。」
不久之後(2016 年 10 月份)CMU 機器學習教授 Russ Salakhutdinov 在自己 Twitter 上宣布了就任蘋果人工智慧研究負責人的消息。之前在人工智慧研究上一直處於隱藏模式的蘋果,終於宣告與谷歌、Facebook 等科技巨頭展開直接競爭。
在 2016 年底的 NIPS 學術會議上,Russ Salakhutdinov 打破了蘋果一貫的沉默,向世人宣告了蘋果在人工智慧發展上的具體目標。該公司還給出了一些細節來說明自己相對於競爭者的優勢,這一系列舉動終於揭開了蘋果人工智慧研究的面紗。
最終,這些成果在剛剛於聖何塞開幕的 WWDC 2017 開發者大會上有了完整的展現。本次大會圍繞軟、硬體,介紹了蘋果融合了機器學習與人工智慧的產品。在軟體方面,以 Siri 為核心,在各種官方 App 裡面用機器學習技術進行優化;硬體方面,首當其衝的就是提升硬體配置,這次 Mac 擺脫了低配置的標籤,蘋果拿出了強大的硬體系統(iMac Pro)投入市場。
蘋果WWDC 2017大會第一天集錦_騰訊視頻 https://v.qq.com/x/page/j0510s7492g.html在一個主題為「沒有蘋果的世界」的搞笑短片結束後,蒂姆·庫克走上講台,事先說明這是史上最好、最大的蘋果開發者大會,共有來自全球 75 個國家的 5300 名開發者來到現場。
圍繞蘋果整條產品線的四種操作系統,tvOS、watchOS、macOS 以及 iOS,庫克宣布了六項重要發布。在 tvOS 上,蘋果宣布 Amazon Prime Video 將在今年登陸Apple TV,引入全部亞馬遜旗下的視頻資源。而在下一代iWatch 系統 WatchOS 4 上,蘋果提出了新主題、機器學習輔助、運動器材互動等多個新功能。在 macOS 上,蘋果的新一代系統 High Sierra (版本號10.13)加入了更多機器學習元素,在瀏覽器 Safari 上不僅可以自動隔離廣告,還有一個自動反跟蹤防護功能,可以智能隔離跟蹤代碼,屏蔽討厭的推薦廣告。
而在最為引人關注的 iOS 11 上,除了照片壓縮、Siri 支持新語言、AR Kit、文件管理系統、全新的界面外,蘋果更為 iMessage 增加了匯款功能,讓用戶間可以在簡訊界面里直接互相打錢。
iPad上的 iOS 11 出現了一個激動人心的升級——底部增加了 Dock,可以固定常用的應用,就像你的 Mac 系統一樣本次 macOS 的更新主要集中於系統性能優化上watchOS 4 實現了手錶和健身器材之間的數據同步在 iOS 11 上,通知中心被重新設計,蘋果更加入了人們期待已久的原生文件管理系統
Metal 2 與 Core ML
計算力
我們知道人工智慧發展一大核心是計算力。在 WWDC 2017 上,蘋果宣布的 Metal2 與新硬體平台能提供機器學習所需的強大計算力。
首先,蘋果宣布了最新的 Metal 2 圖 API,介紹了大量 High Sierra MacOS 操作系統如何處理圖的新進化。其中有趣的一點是它對外部圖解決方案的支持。蘋果開放了 Metal 2 外部圖開發者 Kit 的指令,包括允許外部 GPU 附件的 Thunderbolt 3,以及 AMD Radeon RX 580 顯卡。這意味著開發者能夠嘗試各種應用外部 GPU 的最好方式,在計算力上這會提供極大的支持。
Federighi 介紹說,Metal 2 不只用於圖像處理,也可以用來進行機器學習。它能加速所有類型深度學習演算法的 Metal 性能著色器。
在這部分演示中,蘋果著重強調的是在 GPU 性能方面的提升,蘋果為展示 GPU 性能的提升,在現場演示了使用 iMac 進行 VR 處理。接著蘋果提到了即將在今年年末發布的工作站級別的 iMac Pro 一體機,將會具備超強的性能,核心為了支持 Machine Learning 和 VR。
Core ML
前文提到,面向開發者的 Metal 2 也能用於機器學習。後面的演講中,Craig Federighi 就宣布了蘋果一系列新的面向開發者的機器學習 API,包括面部識別的視覺 API、自然語言處理 API,這些 API 集成了蘋果所謂的 Core ML 框架。
Core ML 的特性:支持深度神經網路、循環神經網路、卷積神經網路、支持向量機、樹集成、線性模型
Federighi 介紹說,Core ML 的核心是加速在 iPhone、iPad、Apple Watch 上的人工智慧任務,包括面部識別、文本分析等。他表示,Core ML 在 iPhone 上每分鐘圖像識別的速度是谷歌 Pixel 上的 6 倍。Siri Intelligence 與智能音箱 HomePod
谷歌的 Google Assistant、亞馬遜的 Alexa、微軟的 Cortana、蘋果的 Siri,都是業界極為關注的語音助手。在此次的開發者大會上,Siri 有了一系列的升級,這些升級集成了大會上所說的 Siri Intelligence。同時,蘋果也發布了配備 Siri 助手的智能音箱 HomePod。
值得一提的是,2014 年蘋果將 Siri 的語音識別移植到了基於神經網路的系統上,使用深度學習對它進行了極大的增強。這裡面使用到了一些早期技術,包括隱馬爾可夫模型。但從這個時間節點開始 Siri 使用了機器學習技術,包括 DNN(深度神經網路),卷積神經網路,長短期記憶單位,封閉複發性單位(gated recurrent units),以及 n-grams 等。
經過三年的發展,Siri Intelligence 結合機器學習有了最新的進展:
Siri Voice 使用深度學習進行語音合成(男聲、女聲)
Siri 將具備 Knowledge 、 Translate Beta 功能
Siri 將具備理解自然語言的功能(對語境更為敏感)
Siri 翻譯功能展示
之前業內一直在傳蘋果在 WWDC 大會上有可能推出重磅產品 Siri 音箱。認為這款產品將直接與亞馬遜的 Echo、Google 的 Home 展開競爭。彭博社的報道也稱,蘋果正在研發的 Siri 音箱將在不久的將來發售。
在大會上,蘋果正式宣布了智能音箱 HomePod。
HomePod 使用 Siri 助手,能夠控制新聞、文本、簡訊、天氣等。但就蘋果的態度來看,HomePod 是要徹底改造(reinvent)家庭音樂,所以它的核心還是音樂,Siri 的功能輔助成分要大很多。
融入產品的人工智慧
Safari 的智能追蹤防護
不像是 AI-First 的谷歌所舉辦的開發者大會,「機器學習」一詞貫穿始終,WWDC 2017 上「機器學習」完全是伴隨著蘋果的產品和應用所出現的:
Safari 使用機器學習識別網頁追蹤者,增強隱私保護;
圖像 App 升級,特別是 Memories 功能使用機器學習識別體育活動、婚禮等圖;
Apple Store 使用深度學習辨別騙保行為;
蘋果 News 應用,採用機器學習挑選出你可能感興趣的新聞源;
Apple Watch 利用機器學習檢測用戶在鍛煉狀態還是僅僅在閑逛;
Apple Pencil 觸控筆的「防手掌誤觸」機器學習模式。
總體看來,蘋果的戰略不是說幫助開發者研發新技術,而是幫助他們將最新的深度學習技術應用到蘋果整個生態系統中。
總結
整場信息量巨大的 Keynote 看下來,給我們的感覺是蘋果在 AI 領域的核心任務不是做研究,而是將現有的 AI 技術優化、應用到蘋果現有的體系中。在最後的回顧中,Tim Cook 甚至都沒有怎麼提到機器學習,由此可以看出蘋果對待 AI 技術的態度。
在這場 AI 爭奪戰中,比較高調的 Google、Facebook,以及在 AI 領域的沉浸多年的微軟都比較看重人工智慧的研究。而對蘋果而言,在即將到來的 AI 時代,他們彷彿要做的:一是用好別人研發出的好技術(提到了在 iphone7 上跑 inception v3)提升產品體驗;另一個則是給開發者提供好開發平台(增強的硬體)。
就像蘋果全球市場高級副總裁 Phil Schiller 在 Backchannel 的採訪中所說的那樣,「典型的蘋果用戶,將在不知不覺中得到機器學習帶來的用戶體驗的提升,並因此更加愛上蘋果產品。最讓人興奮的是,你甚至都感覺不到它的存在,直到有一天你突然意識到,並發出由衷的感嘆:這一切是怎麼發生的?」
機器之心報道
推薦閱讀:
※機器學習進階筆記之十一 | 利用TensorFlow實現智能數字識別
※小米年會雷軍定下2017年小目標:收入破千億元
※設計師的機器學習系列隨筆1-設計師為什麼要學機器學習
TAG:苹果公司AppleInc | WWDC | 人工智能 |