Apple在人工智慧上是否已經落後了?
個人體驗,Siri相較於微軟的Cortana和Google的Google Now,在語義理解,內容呈現上均不如後二者。Google Now能對我需要的內容的準確推送在海外Google配套服務齊全的環境下簡直令人吃驚。在朋友的手機上也把玩過Cortana,直觀的感受就是識別率要比Siri高許多(英語)。那麼是否可以認為Apple在語音助手,或者說人工智慧領域已經落後了呢?
恰好發了篇文章說這個:https://zhuanlan.zhihu.com/p/24735213
蘋果在人工智慧上技術上或許不是領先,但走了一條群眾路線,還是有望成為人工智慧產品消費市場的霸主。
在剛剛結束不久的NIPS大會上,Google不但作為鉑金贊助商強勢佔位,而且攜28篇論文亮相,不可不謂風頭無二。 據悉Google搞深度學習的不下500人,也發布了TensorFlow等一系列有影響力的開源框架。
蘋果則在深度學習領域似乎動作緩慢,人工智慧界著名的大(pen)嘴(zi) ,Facebook人工智慧實驗室總監LeCun也怒噴蘋果在人工智慧學術圈根本沒有一席之地。(當然被他噴過的人很多,以後有機會再八)
不過LeCun萬萬沒想到,蘋果卻很可能走上了一條農村包圍城市的道路,默默在憋大招,搞了一套叫Metal的深度學習框架,讓所有程序員都可以輕輕鬆鬆的使用深度學習。深度學習有望在蘋果的帶領下發揚光大,讓其他競爭對手陷入人民戰爭的汪洋大海中...
先來看一個演示:
這是利用蘋果的深度學習開發包Metal調用CNN做的圖像識別的演示,可以看到它能在手機上實時的識別出筆記本,iPod,或者是遙控器。
注意,這裡有兩大亮點,第一就是輸入是實時的視頻流,第二就是無需聯網在iPhone本機就可以做。
簡單的說,蘋果的深度學習開發包Metal能夠讓廣大iOS開發者非常方便的調用Metal提供的API來輸入數據,選擇模型,以及設置並發,並通過Shader的封裝直接控制GPU。
再直白點,只要你懂Swift,只需要一台最新的iPhone 7手機,你就能開發基於深度學習的應用!
這套Metal的框架,讓你能夠搭積木一樣搭出一套深度學習的應用,並提供了一套介面讓你直接操控GPU里的運算單元(得益於A10晶元是蘋果自己做的)。
在程序員大致了解了各種神經網路的適用範圍之後,拍腦袋或者實際測試自己適合的神經網路模式,然後就可以鼓搗深度學習的應用了,就像寫Swift代碼一樣容易。
是的,童叟無欺,你可以做語音識別、圖像識別、NLP等各種應用,文末我還會提供源代碼!
比如利用Metal這個框架,你可以做語音識別!下面是個Demo:
你還可以調用CNN做圖像識別,深度學習技能Get!
(實時演示請看:https://raw.githubusercontent.com/shu223/iOS-10-Sampler/master/README_resources/digit.gif)
其他的圖像聚類啊打標籤啊,也是分分鐘的事情啊!
嫌這個圖像識別太簡單?
第一個例子里,你能開發基於深度學習的實時圖像識別,也就是直接用手機攝像頭做實時的圖像識別。
操作各種圖片,聚類啊,打標籤啊,濾鏡什麼的,那是分分鐘的事情。
瞬間,你就成了會深度學習懂人工智慧的高科技碼農,想想是不是有點小激動啊?
不得不說,Metal對於iOS開發者,甚至是所有的程序員來說是意義極其重大的(可以想像其他廠商也許會跟隨,不過壁壘在於蘋果是自己開發的A10晶元才能夠操作底層GPU):
這是一件「開發者的大事,大快所有人心的大好事」。
還不信么?
我們去採訪了Polarr的CEO Borui Wang,他給我們展示了他們基於Metal的API做的一個相冊應用Picky Album,中文叫「霹靂相冊」。
這個APP可以智能圖片聚類,挑選最好的照片,並且能智能修圖。
在霹靂相冊里輸入"cat",相冊里所有貓的圖片就出來了!(下次更新的時候會推出此功能)
輸入"church",相冊里所有教堂的圖片都出來了!
對iOS開發者的意義
Borui Wang在採訪中表示,Metal這個框架對於iOS開發者而言意義重大,蘋果開發者等於擁有了直接在本地做深度學習的能力(當然其實需要提前訓練好)。
可以在本地做圖像識別、語音識別、自然語言處理、圖像聚類等各種功能,效率上會有極大的提升。
目前霹靂相冊在iPhone本地用10分鐘左右就能為幾千張圖片做索引,接近1秒處理10張圖片,而傳統的深度學習需要在雲端計算,上傳一張圖片最快也要接近1秒鐘,這已經是10倍以上的效率的提升。此外,Metal還在開發一個批處理功能,在未來幾個月內,批處理的預計能提升5-10倍的效率。
霹靂相冊除了使用深度學習進行圖像處理,也利用深度學習做智能挑圖,通過記錄用戶挑選最佳照片的行為,優化智能推薦引擎。
Metal這個框架對電商類應用,以及涉及到人臉識別、圖像識別、自然語言處理的應用都會有量級的提升,此外,在iPhone上做深度學習,將擺脫對網路的依賴,解決了網路延遲的問題,也為用戶節省了流量。
目前蘋果官方還在改進Metal的性能,提高並發能力,預計明年一二月份會有最新的版本。
蘋果的「Apple Brain」戰略
Metal框架的推出,暗合了蘋果「Apple Brain」的戰略,是的,傳說中的「Apple Brain」已經內置於你的iPhone中。
在這個戰略下,Apple在2015年收購了人工智慧初創公司Perceptio,後者主要是在手機本地做深度學習,同時與之配合的是硬體層面上iPhone 7採用了蘋果自己設計的搭載6核GPU的A10 Fusion,計算能力大幅提升。
區別於谷歌等Google Brain都是在雲端,蘋果選擇了把蘋果大腦放在你的手機上!
蘋果選擇在本地做計算也有保護隱私的考量,這緩解了雲端數據的安全隱患,也發揮了自己最大的優勢,自己的設備大量被裝在了用戶的口袋裡。
這個策略的選擇一方面也是無奈之舉,雖然4G網路不斷發展,但是網路帶寬和速度的問題一直沒有得到解決。計算機科學家想像中的那種只需要一個客戶端來訪問,然後把計算都放到雲端的美好想法一直舉步維艱,網路基礎設施依然步履緩慢,比如Google Fiber計劃就困難重重。
Metal這套框架如果成功,以後很有可能Siri不需要網路也能運行,而當前Google Assistant和Amazon Echo等都是在雲端運行。除了可以本地跑Siri,同樣可用於識別陌生來電,自動顯示附近標記的酒店等功能都可以做。
那麼蘋果手機也不再是一個簡單的智能手機,而是一個無所不能的感測器,能感知你的位置你的溫度你的環境,簡直成了你大腦的自然延伸。
當然,Metal更重要的意義在廣大開發者都擁有了深度學習的武器!
福利
Metal的開發文檔:https://developer.apple.com/metal/
Metal的Demo 代碼鏈接:shu223/iOS-10-Sampler
歡迎關註:嚴肅 - 知乎
AI專欄:Take AI Seriously
蘋果主要靠買公司解決此類問題。
我印象中Apple從來並沒有領先過。而且我一直以為這是家硬體公司。。。
是的。就我個人感覺還沒有Facebook厲害,不知道能不能比的過百度。
根本不是一個類型的公司,MS和Google都是技術型的,Apple是設計型的,不能讓達芬奇跟牛頓比物理吧。
用iPhone的相冊,搜:
人
電
海
室內
運動
天
太陽
歡迎補充
蘋果落後……watson不是來了嗎?
Quora傳送:Who is leading in AI research among big players like IBM, Google, Facebook, Apple and Microsoft?
Apple is not a player in the AI research circuit because they have a very secretive culture. You simply cannot do leading-edge research in secret. If you can』t publish, it』s not research. At best, it』s technology development.
有錢不怕落後
蘋果從來就不是一間技術導向的公司
人工智慧能給手機電腦帶來直接的好處嗎?蘋果為啥要花大力氣投入這種無法給用戶帶來顯著好處的領域?
推薦閱讀:
※有哪些調戲 Siri 的方法?
※為什麼 Siri 聽懂了我的話,還是不能做出有效的回答或準確的操作?
TAG:人工智慧 | 蘋果公司 (Apple Inc.) | 谷歌 (Google) | Siri | Cortana |