小米崔寶秋:走CBA技術主線,AI是未來十年的核心戰略
去年,雷軍逐步將重心轉移到AI技術和應用的研發上來,AI也逐漸上升為小米未來的核心戰略,不久前,小米發布2018年第一款AI手機。在3月29日的2018新智元產業躍遷AI技術峰會上,小米人工智慧與雲平台副總裁崔寶秋全面剖析小米的CBA技術主線。
2018年,小米發布了第一款AI手機。
去年,雷軍靠著對供應鏈改造和內部管理實現手機銷量「逆襲」,之後逐步將重心轉移到AI技術和應用的研發上來,AI也逐漸上升為小米未來的核心戰略。不過,相比「All in AI」、「AI in All」以及「AI First」等口號,小米的AI之路相當低調。
這種低調一方面是因為小米是一家更注重產品落地的公司 ,另一方面是因為實現AI+IoT是一項龐大的工程,需要系統性思考和布局。
小米從不缺少數據,小米在雲計算和大數據方面也有很深的積累。MIX 2S使用的晶元屬於高通的第三代AI平台,而手機、音箱等設備也是AI場景應用的主要實現載體。這一切因素都齊全了,小米的AI之路該怎麼走?
近日,小米人工智慧與雲平台副總裁崔寶秋出席了2018新智元產業躍遷AI技術峰會,全面剖析小米的CBA(Cloud Computing、Big Data、Artificial Intelligence)技術主線。
C:Mi Cloud、融合雲、生態雲,構建小米生態
2012年,小米全年的手機銷量破紀錄的達到719萬部,大量的照片及視頻對數據存儲提出了要求。
也就是那年的年初,崔寶秋被雷軍說服從美國歸來加入小米,負責小米的互聯網後台技術架構和雲平台建設。幾乎是從零開始,崔寶秋開始組建小米雲平台團隊。小米雲平台主要是一個技術平台部門,但它也負責一款產品,也就是小米雲。「小米雲不是一個公有雲服務提供商,不對外提供服務,這是區別於阿里雲、金山雲等最重要的特徵。」崔寶秋說,目前小米雲有Mi Cloud(小米雲服務)、融合雲和生態雲三大板塊內容。
Mi Cloud於2012年7月開始成立,是小米手機用戶的個人數據中心,對標蘋果iCloud,小米手機中的聯繫人、通話記錄、便簽、照片、視頻等信息都會同步到雲端。
在小米公司內部,很多業務團隊都有存儲和計算的需求,例如智能語音,計算機視覺,MIUI瀏覽器,金融,音樂等等,同時很多工程師,例如研發,測試等等,也需要靈活的計算資源分配。為了更高效的滿足公司內部需求,小米建設了小米融合雲,用私有雲形態為公司內部各個團隊提供雲服務,同時也支撐著公司的大數據挖掘和分析。
小米在智能硬體領域投資了很多家生態鏈企業,2014年,小米開始建設小米生態雲,目的是為眾多小米生態鏈企業以及合作夥伴企業提供一站式的雲服務和解決方案,用雲服務的形式打造小米的大數據生態和人工智慧生態。
B:數據科學在腦海里根深蒂固,小米有天生的優勢
在加入小米之前,崔寶秋曾就職於雅虎和 LinkedIn,這兩段工作經驗,讓大數據和數據科學概念在他的腦海里根深蒂固。
當時在中國講數據科學曾遇到一些尷尬,互聯網行業中,真正理解數據科學的人不多,優秀的數據科學家更是稀缺。在崔寶秋看來,小米不僅僅是一個手機公司、更是一個移動互聯網公司,一個新零售公司,最重要的是一個大數據公司,這也是他認為小米能夠在移動互聯網時代崛起的重要原因。
基於大量的手機和IoT設備,小米天生具備獲取大數據的能力,有了數據,就有了訓練模型的基礎材料。
A:AI是小米未來十年的核心戰略
如果潮流來了,一個公司沒有準備和積累,那麼它就會錯過機會。
人工智慧在四、五年前逐漸興起來的時候,小米雖然有一些自然語言處理、大數據分析和機器學習的積累,但是深度學習在很多領域的應用是沒有布局的。
2014年,亞馬遜推出智能音箱,將語音交互技術應用在傳統音箱中,讓人們看到了人工智慧應用的巨大場景;2016年,AlphaGo擊敗李世石,深度學習向世界展示了它的威力。「要感謝AlphaGo,讓我們看到了深度學習的潛力。」崔寶秋說。
到了2016年,小米立項做第一款戰略級AI產品——小米AI音箱。「當時我們幾乎什麼也沒有,AI音箱的大腦團隊是從大數據團隊、搜索團隊抽調過去,到今天這個團隊就演變成小愛團隊。」崔寶秋說。
2017年,小米雲平台改名人工智慧與雲平台。依靠小米之前的數據積累、雲計算積累,通過對機器學習和深度學習平台的搭建,小米抓住了AI的潮流並實現了技術落地。
截至到2018年1月,搭載「小愛同學」的智能設備累計激活數已經超過1000萬,這也讓「小愛同學」成為小米最有價值的智能語音交互平台。在一次內部會議上,雷軍說,AI是小米未來十年的核心戰略。
「我們壓力很大,這是機遇和挑戰並存下的壓力。錯過這波機會就太可惜了,團隊如果沒有為小米抓住機會的話,我們就成了』罪人』。」目前,崔寶秋負責的人工智慧與雲平台團隊共有800多人,其中AI團隊數量佔一半左右。
以下是崔寶秋在峰會上的演講:
崔寶秋:非常感謝楊靜楊總的邀請, 很高興有機會跟大家交流,我今天分享的題目是「小米的人工智慧之路」。
我在小米負責人工智慧與雲平台團隊,這兩年在新的AI浪潮之中我感到非常興奮,因為20多年前我自己學的也是人工智慧,但是當時我學的是邏輯程序設計,基於邏輯、推理、專家系統的人工智慧技術。回頭看,那個時代是AI的寒冬,今天,AI迎來了另一個春天,這是非常讓人興奮的。小米在AI上做了哪些事情呢?今天跟大家分享一下。
好多人對小米的認知還停留在小米是一個手機公司,對小米做的事情不太了解。小米不僅是手機公司,更是移動互聯網公司、智能設備公司、新零售公司,而真正了解小米模式的朋友知道,小米也是一家大數據公司,一家AI公司。
我在五、六年前加入小米,推動數據驅動,一年多前我把它升級為AI驅動。
在小米,我們從2012年開始在很多領域已經用到AI,只不過當時大家沒有那麼深刻認識到深度學習這種新的AI技術的應用。在雅虎時代、Google時代,好多做人工智慧的人都不屑於或者不願提人工智慧。但是人工智慧技術已經在小米或者在各個互聯網公司應用得幾乎無處不在,比如搜索。過去很多年我一直做搜索,AI的技術在小米十多款搜索應用裡面很早就得以呈現,還有個性化推薦。小米有很多內容,如何做到千人千面,把最好的內容推送給最合適的用戶,也是人工智慧可以發力的。
比如,我們團隊和小米電視團隊合作,推出了千人千面的拼圖牆,這個人工智慧技術帶來了流量、帶來了用戶的增長。小米電視的開屏率、觀看時長都隨之翻了幾倍。
今天我想講的是,2016年開始AlphaGo讓人們認識到新的人工智慧技術,也就是深度學習的興起。我們為什麼從2016年開始要真正深度擁抱AI?今天的AI在小米意味著什麼?可能跟前幾年完全不一樣。
AI在小米將深度無處不在,兩大原因:
第一,小米有豐富的產品線。剛才香蕉出行演示的翻譯機就是小米生態鏈企業產品的一個代表,小米手機是現在人工智慧技術的最大平台,圍繞手機,圍繞IoT,幾乎所有的產品都需要AI賦能。
第二,幾乎所有的AI技術,在各個垂直領域,都會在小米的產品線中得以施展,得以應用,這一點相信大家都同意。我給我的同事們講,我們要在很多地方積累自己的力量,積累自己的技術與團隊,因為隨時隨地都有可能有新的需求產生。今天沒有的產品形態,下個月可能就有,今年沒有的可能明年就有。原來說的智能設備之所以是智能,主要是因為它可以連到雲端,可以和手機互聯互通,但是我認為那些不是真正的智能,我們現在需要最好的AI技術,真正變得智能。
深度學習讓AI火了起來,大家都在談ABC(雲計算、大數據、人工智慧),過去小米的技術路線發展圖實際上是從C到B到A的。我在很多地方都講過,深度學習後面有很強的大數據功勞,沒有大數據不能談深度學習,大數據背後需要有強大的雲服務、強大的算力。小米過去幾年打造了強大的雲技術團隊,從C開始到B,組建了小米的大數據團隊,招聘數據科學家,招聘這個團隊花了不少時間。2016年大力投入AI,圍繞深度學習打造小米AI團隊。AI今天已經成為小米的核心戰略,是未來10年20年最重要的戰略。
有些同行跟我講,你們小米只是用AI而不是做AI吧 ?我說小米是做AI的。小米在AI上有三大優勢,不做AI實在可惜:
第一個優勢,我們有很強的硬體優勢,小米手機的設計製造能力代表了小米在硬體上的各種優勢和水平。小米AI音箱也充分顯示了我們的這個優勢。
第二個優勢,小米有很強的大數據獲取能力。
第三個優勢,小米的廣深的生態鏈布局,也就是產品線。很多人講,小米在AI上投入再多都不為多,這一點我非常認同。
這是小米的AI能力圖譜:從基礎的大數據、深度學習,到中間的感知、認知層,再到上面的開放平台,對接小米的各個業務與產品,以及生態鏈的產品。
小米在AI上有了一定的技術積累,哪些技術在哪些產品上落了地呢?
首先看看視覺,視覺演算法在一些產品上的應用,包括相機,人臉解鎖、美顏還有雲相冊。我們領先蘋果iCloud一年左右的時間推出了面孔相冊,演算法團隊做出的魔法消除和智能補全,可以把你照片中不想要的內容去掉。
3月27日我們發布了MIX 2S,帶來了我們的AI相機功能,場景識別今天可以識別25個大的種類,細分有206種之多。基於場景識別,比如會場內、室外、還是雪山等等,動物、植物,以及美食,在不同場景下需要用不同的設置,不是攝影高手很難做到完美,AI可以幫你近乎做到完美。再舉幾個例子,這幾張圖片前天發布會上雷總也講了,左邊是沒有處理的,右邊是AI相機做的,感覺很不一樣。還有多雲天氣左邊是什麼樣的,右邊是什麼樣的,AI場景模式截然不同。另外,我們的人臉解鎖,也即將在一些產品上落地。
AI單攝背景虛化,這是今年團隊做的我個人比較滿意的一個亮點。大家都知道現在各種廠家在硬體上投入很多,長焦、廣角、雙鏡頭等等,對背景虛化很有幫助。中國的女性用戶特別喜歡自拍,如何把自拍拍好,而前置的攝像頭基本都是一個鏡頭,怎麼做好?小米做出了自己的演算法,在印度版和中國版紅米Note5上面發布,印度的專業媒體發表一致好評,超過很多知名品牌。我們與眾不同的地方,比如頭髮絲還有衣服的毛領部位都處理得很好,細節處見精神,小米為此打磨了很久。
針對印度人群我們也做了一些優化,比如印度的男性朋友也特別喜歡自拍,對他們的鬍鬚做一些特殊處理。還有印度婦女穿的很多民族服裝以及飾物,也做了特別優化。為什麼我們的演算法在印度獲得一致好評?離不開團隊在這方面做出的努力。
前天發布會引起觀眾尖叫的一個功能就是手機上的」小愛同學」。很多人可能知道,今年我給團隊的一個目標,就是把「一句話的事兒「在手機上做到極致。小愛同學是一個喚醒詞,去年發布了小米AI音箱,大家稱它為小愛音箱。選AI音箱作為小米第一款AI戰略性產品是有原因的,因為音箱這款產品可以把團隊的積累,從大數據、搜索、推薦、NLP、語音識別到合成、聲學、深度學習平台等等技術全部串起來。除了視覺以外,小愛同學或者小愛音箱促進了整個AI團隊的成長壯大。小米AI音箱一經發布,受歡迎的程度超出預期,在京東上獲得了令人無法置信的百分之百的用戶好評。從用戶體驗和用戶好評度上看,雖然發布的不是最早,但是小愛同學幾乎成了智能音箱的代名詞。前天我們發布了小愛音箱mini版,每個家庭裡面每個卧室都可以放一個。
在小米手機上我們也內置了小愛同學,把原來小米手機的語音助手,類似蘋果的Siri,重新命名叫做小愛同學,可以做到熄屏喚醒。小愛同學背後積累了很多AI能力,先給大家放一段視頻看一下。
小愛同學的知識水平會越來越豐富,越來越可愛,越來越懂你,將來我們會深度打造小愛同學背後的一個小米虛擬助手。
小愛同學是一個智能語音交互平台,有很多種技能,每周會有更多的更新,大家可以期待。它現在可以控制很多智能設備,是我們的一個戰略性產品。小米希望通過小愛同學控制所有的IoT設備,也就是所謂的智聯網。目前小米的IoT平台有8500萬個在線的聯網設備,小愛同學將來可控制的產品會越來越多。小愛同學促進了小米AI領域的全面提升,包括遠場增強、分散式拾音、喚醒等等。我們打造了國內首家全自動遠場聲學實驗室,同時也在牽頭、聯合行業中的多家公司、學術界、政府來推動小米的聲學標準。我們的ASR演算法線上業務語音識別的字準確率非常驚人。15年前我在IBM工作的時候曾參與IBM語音識別測試,但數年後也未見語音產品落地。今年我們小米語音識別團隊用不到一年的時間達到這個數字,靠的是什麼?靠的是深度學習技術,靠的是後面豐富的語料。
小米的知識圖譜在快速發展,現在小愛同學背後的知識每個季度都在翻番往上漲,將來小愛同學只會越來越聰明,智能問答團隊在為小米用戶提供各種知識獲取來源。
從雲計算到大數據到今天的AI,開源技術是我們一直擁抱的。在深度學習方面,基於TensorFlow、Kubernetes,我們一早就推出了小米自己的深度學習雲服務,從PaaS到SaaS,對小米內部各個業務開放,也對小米生態鏈企業開放。另外,我們準備開源小米自己的移動端深度學習框架,今天這個框架已經支持了CPU、DSP、GPU、高通和我們自己的澎湃晶元,支持TensorFlow和Caffe等模型,我們的目標是打造業內最好的移動端深度學習框架,Q2即將開源。
我們堅信智能手機是人工智慧的最大平台,智能手機加上IoT將為AI帶來一個無限的生態。我們相信,利用AI的最新技術,我們可以更快實現小米的願景——讓每個人都能享受科技的樂趣。
謝謝大家!
(本文首發於新智元微信公眾號:AI_era,歡迎關注!)
推薦閱讀:
※AI技術正以五種方式改變軟體測試工作
※虛幻4自學筆記——基本從零開始搭建一個完整的關卡(包含AI)——第二篇
※全球首家幼兒AI學校在矽谷開業了,但……事情並沒有這麼簡單
※經濟學人:谷歌、亞馬遜等巨頭有數據技術優勢,會接管麥肯錫、波士頓諮詢手中業務
※飯桌上聊起人工智慧,這是最周全的科普姿勢。