Apple在人工智慧上是否已經落後了?

個人體驗,Siri相較於微軟的Cortana和Google的Google Now,在語義理解,內容呈現上均不如後二者。Google Now能對我需要的內容的準確推送在海外Google配套服務齊全的環境下簡直令人吃驚。在朋友的手機上也把玩過Cortana,直觀的感受就是識別率要比Siri高許多(英語)。那麼是否可以認為Apple在語音助手,或者說人工智慧領域已經落後了呢?


恰好發了篇文章說這個:https://zhuanlan.zhihu.com/p/24735213

蘋果在人工智慧上技術上或許不是領先,但走了一條群眾路線,還是有望成為人工智慧產品消費市場的霸主。

在剛剛結束不久的NIPS大會上,Google不但作為鉑金贊助商強勢佔位,而且攜28篇論文亮相,不可不謂風頭無二。 據悉Google搞深度學習的不下500人,也發布了TensorFlow等一系列有影響力的開源框架。

蘋果則在深度學習領域似乎動作緩慢,人工智慧界著名的大(pen)嘴(zi) ,Facebook人工智慧實驗室總監LeCun也怒噴蘋果在人工智慧學術圈根本沒有一席之地。(當然被他噴過的人很多,以後有機會再八)

不過LeCun萬萬沒想到,蘋果卻很可能走上了一條農村包圍城市的道路,默默在憋大招,搞了一套叫Metal的深度學習框架,讓所有程序員都可以輕輕鬆鬆的使用深度學習。深度學習有望在蘋果的帶領下發揚光大,讓其他競爭對手陷入人民戰爭的汪洋大海中...

先來看一個演示:

這是利用蘋果的深度學習開發包Metal調用CNN做的圖像識別的演示,可以看到它能在手機上實時的識別出筆記本,iPod,或者是遙控器。


注意,這裡有兩大亮點,第一就是輸入是實時的視頻流,第二就是無需聯網在iPhone本機就可以做。


簡單的說,蘋果的深度學習開發包Metal能夠讓廣大iOS開發者非常方便的調用Metal提供的API來輸入數據,選擇模型,以及設置並發,並通過Shader的封裝直接控制GPU。


再直白點,只要你懂Swift,只需要一台最新的iPhone 7手機,你就能開發基於深度學習的應用


這套Metal的框架,讓你能夠搭積木一樣搭出一套深度學習的應用,並提供了一套介面讓你直接操控GPU里的運算單元(得益於A10晶元是蘋果自己做的)。

在程序員大致了解了各種神經網路的適用範圍之後,拍腦袋或者實際測試自己適合的神經網路模式,然後就可以鼓搗深度學習的應用了,就像寫Swift代碼一樣容易。


是的,童叟無欺,你可以做語音識別、圖像識別、NLP等各種應用,文末我還會提供源代碼!

比如利用Metal這個框架,你可以做語音識別!下面是個Demo:

你還可以調用CNN做圖像識別,深度學習技能Get!

(實時演示請看:https://raw.githubusercontent.com/shu223/iOS-10-Sampler/master/README_resources/digit.gif)

其他的圖像聚類啊打標籤啊,也是分分鐘的事情啊!


嫌這個圖像識別太簡單?


第一個例子里,你能開發基於深度學習的實時圖像識別,也就是直接用手機攝像頭做實時的圖像識別。

操作各種圖片,聚類啊,打標籤啊,濾鏡什麼的,那是分分鐘的事情。

瞬間,你就成了會深度學習懂人工智慧的高科技碼農,想想是不是有點小激動啊?


不得不說,Metal對於iOS開發者,甚至是所有的程序員來說是意義極其重大的(可以想像其他廠商也許會跟隨,不過壁壘在於蘋果是自己開發的A10晶元才能夠操作底層GPU):

這是一件「開發者的大事,大快所有人心的大好事」。


還不信么?


我們去採訪了Polarr的CEO Borui Wang,他給我們展示了他們基於Metal的API做的一個相冊應用Picky Album,中文叫「霹靂相冊」。

這個APP可以智能圖片聚類,挑選最好的照片,並且能智能修圖。

在霹靂相冊里輸入"cat",相冊里所有貓的圖片就出來了!(下次更新的時候會推出此功能)

輸入"church",相冊里所有教堂的圖片都出來了!

對iOS開發者的意義

Borui Wang在採訪中表示,Metal這個框架對於iOS開發者而言意義重大,蘋果開發者等於擁有了直接在本地做深度學習的能力(當然其實需要提前訓練好)。


可以在本地做圖像識別、語音識別、自然語言處理、圖像聚類等各種功能,效率上會有極大的提升。


目前霹靂相冊在iPhone本地用10分鐘左右就能為幾千張圖片做索引,接近1秒處理10張圖片,而傳統的深度學習需要在雲端計算,上傳一張圖片最快也要接近1秒鐘,這已經是10倍以上的效率的提升。此外,Metal還在開發一個批處理功能,在未來幾個月內,批處理的預計能提升5-10倍的效率。


霹靂相冊除了使用深度學習進行圖像處理,也利用深度學習做智能挑圖,通過記錄用戶挑選最佳照片的行為,優化智能推薦引擎。

Metal這個框架對電商類應用,以及涉及到人臉識別、圖像識別、自然語言處理的應用都會有量級的提升,此外,在iPhone上做深度學習,將擺脫對網路的依賴,解決了網路延遲的問題,也為用戶節省了流量。


目前蘋果官方還在改進Metal的性能,提高並發能力,預計明年一二月份會有最新的版本。


蘋果的「Apple Brain」戰略


Metal框架的推出,暗合了蘋果「Apple Brain」的戰略,是的,傳說中的「Apple Brain」已經內置於你的iPhone中。


在這個戰略下,Apple在2015年收購了人工智慧初創公司Perceptio,後者主要是在手機本地做深度學習,同時與之配合的是硬體層面上iPhone 7採用了蘋果自己設計的搭載6核GPU的A10 Fusion,計算能力大幅提升。

區別於谷歌等Google Brain都是在雲端,蘋果選擇了把蘋果大腦放在你的手機上!


蘋果選擇在本地做計算也有保護隱私的考量,這緩解了雲端數據的安全隱患,也發揮了自己最大的優勢,自己的設備大量被裝在了用戶的口袋裡。


這個策略的選擇一方面也是無奈之舉,雖然4G網路不斷發展,但是網路帶寬和速度的問題一直沒有得到解決。計算機科學家想像中的那種只需要一個客戶端來訪問,然後把計算都放到雲端的美好想法一直舉步維艱,網路基礎設施依然步履緩慢,比如Google Fiber計劃就困難重重。

Metal這套框架如果成功,以後很有可能Siri不需要網路也能運行,而當前Google Assistant和Amazon Echo等都是在雲端運行。除了可以本地跑Siri,同樣可用於識別陌生來電,自動顯示附近標記的酒店等功能都可以做。


那麼蘋果手機也不再是一個簡單的智能手機,而是一個無所不能的感測器,能感知你的位置你的溫度你的環境,簡直成了你大腦的自然延伸。


當然,Metal更重要的意義在廣大開發者都擁有了深度學習的武器!


福利

Metal的開發文檔:https://developer.apple.com/metal/
Metal的Demo 代碼鏈接:shu223/iOS-10-Sampler

歡迎關註:嚴肅 - 知乎

AI專欄:Take AI Seriously


蘋果主要靠買公司解決此類問題。


我印象中Apple從來並沒有領先過。而且我一直以為這是家硬體公司。。。


是的。就我個人感覺還沒有Facebook厲害,不知道能不能比的過百度。


根本不是一個類型的公司,MS和Google都是技術型的,Apple是設計型的,不能讓達芬奇跟牛頓比物理吧。


用iPhone的相冊,搜:




室內
運動

太陽

歡迎補充

蘋果落後……


watson不是來了嗎?


Quora傳送:Who is leading in AI research among big players like IBM, Google, Facebook, Apple and Microsoft?

Apple is not a player in the AI research circuit because they have a very secretive culture. You simply cannot do leading-edge research in secret. If you can』t publish, it』s not research. At best, it』s technology development.


有錢不怕落後


蘋果從來就不是一間技術導向的公司


人工智慧能給手機電腦帶來直接的好處嗎?蘋果為啥要花大力氣投入這種無法給用戶帶來顯著好處的領域?


推薦閱讀:

有哪些調戲 Siri 的方法?
為什麼 Siri 聽懂了我的話,還是不能做出有效的回答或準確的操作?

TAG:人工智慧 | 蘋果公司 (Apple Inc.) | 谷歌 (Google) | Siri | Cortana |