智能硬體交互有什麼發展趨勢？

12-29

智能硬體來了，究竟什麼是智能硬體，相比PC和智能手機，智能硬體會面臨一些什麼新的交互趨勢呢？

智能硬體，是指通過將硬體和軟體相結合對傳統設備進行智能化改造。

例如可以改造的包括手錶、電視、門鎖、汽車等一系列物品。大家耳熟能詳的智能硬體產品有Google Glass、三星Gear、FitBit charge等。

我看了一下這個問題的日誌，問題是在2014年4月份提出。

回想2014年，當時應該是某一次科技革命的前夜，當時所有與智能硬體相關的技術都在迅猛發展。其實，早在 2012年的時候Google glass第一代就已經發布。

我記得這一年Jawbone發布了UP24的升級版UP3以及Move等智能可穿戴，同時2014年Fitbit發布了第一款帶屏幕的Force（即後來因為過敏問題召回的那款）。總歸就是，當時的智能可穿戴兩大行業巨頭，業務都處在蒸蒸日上的階段。

但誰也沒有料到三年後的今天：Jawbone卻不見了，Fitbit卻收購了兩年前還很火的Pebble。作為智能硬體的創業者，如今看到這些，有點不勝唏噓。

話題好像扯得有點遠，說回問題本身，我想簡單說說幾個目前已經看到的趨勢：

1. 智能音箱語音交互

這個是近年來比較熱門的方向，傳統的智能硬體產品交互起來有一個痛點：假設你要對一個硬體下指令，你需要做如下（繁瑣的）動作：

但是如果你使用了智能音箱的話，其實你只要對著音箱下指令就好了，而如下的流程實際上你可以一氣呵成簡化成一句話（這得益於音箱全向收音技術的發展，你甚至都不需要正對著音箱說話），由於步驟的簡化，效率的提升確實是驚人的：

所以，我們可以看到這段時間智能音箱如雨後春筍一樣出現。一開始只有亞馬遜的Alexa以及Google home，後來蘋果的HomePod、天貓、小米、叮咚等智能音箱也相繼加入戰局。當然，目前智能音箱也存在著一些影響體驗的問題，比如介面不統一，語音識別率低等。不過，我相信隨著硬體及軟體慢慢的迭代下去，體驗一定會越來越好。

另外，由於智能音箱一直在收音狀態，這對注重隱私的人來說是個暫時無法解決的缺點，希望企業在未來可以找到令公眾信服的處理方式和方法。

2. 類Face ID交互（Kinect類交互）

要說今年蘋果如何「改編」了世界，那就不得不提到10周年推出的這個Face ID技術。蘋果的產品經理對新功能的定義確實厲害，而且十分擅長將前沿技術的使用體驗做到讓大眾信服的程度。比如這個Face ID技術，在手機的前額塞入一台迷你Kinect，比起虹膜解鎖、面部解鎖、指紋解鎖等，改進的程度和使用體驗實在是好太多。

（圖片來自蘋果官網）

俗話說：供應鏈無秘密，相信各大手機廠商已經在開發或已經準備在開發類似技術，就像當年的touch ID一樣，估計大家很快就能體驗到類似技術甚至會獲得改良後的交互體驗。

既然提到了迷你Kinect，這裡我想再說說Xbox one標配的Kinect：

（圖片來自微軟官網）

這在當時是個非常未來的交互方式，這個Kinect可以捕捉到你肢體（包括頭部面部）的動作並和設備產生實時交互，但可惜的是，這個設備微軟前幾天已經宣布停產。

3. AI/無人駕駛相關（所以最未來的交互難道就是…沒有交互？）

鋼鐵俠的AI助理賈維斯大家已經很熟了，這裡就不提了（哈哈）。

關於AI，這幾年大家肯定聽說過阿爾法狗（Alpha Go）下棋天下無敵的事情。有關AI的技術有很多新聞，很多也人都在關注這一塊，就像每一次工業革命一樣，都會湧現出一批受益群體或者是失勢群體，這是歷史的車輪無法逆轉。大家要做的或許就是緊跟技術的步伐，才不容易被社會淘汰。

（圖片來自網路）

而關於自動駕駛這塊，大家最了解的可能是Tesla的Auto pilot無人駕駛，而我卻更關注google所主導的無人駕駛。不為人所知的是：在2016年12月13號，Google旗下（alphabet）的自動駕駛汽車項目，已經被分拆為一家獨立的公司叫做Waymo，而Waymo這家公司名代表的就是「未來新的機動模式（A new way forward in mobility）」。

不過這都不是重點，因為最近我在癮科技主站讀到了一篇文章：

（截圖自癮科技主站）

裡面提到Waymo現在的一個理論是：他們認為自動駕駛的車子在遇到緊急情況的時候將不會求助於（車上的）人類。因為他們的一些調查發現車上的乘客，在很多狀況下的角色就近似於「真的乘客」，在遇到緊急情況時，AI如果將控制權交給車上的人，他可能在那一瞬間是懵的，甚至並不能做出優於AI的選擇。對人類本身的思考，他們是很深刻的，所以Waymo當之無愧的處在自動駕駛第一梯隊無誤。

4. AR/手勢/投影交互

科技的發展應該是化繁為簡的，這是個大前提。

今年AR也是蘋果的一個趨勢。前幾年AR算是有一些熱度，但是沒有較好的方向和定義，高通的AR SDK甚至都被出售給了PTC，不管怎麼說AR算得上是一個非常有前景的技術，在蘋果入場後更是如此。

我按等級把AR分為三種：

l 初階的需要一張卡片，打開App去掃卡片，出現特定的菜單，多用於玩具應用；

l 中階的需要掃特定的物體，比如蘋果總部的喬布斯禮堂等，也可以是某一枚徽章等，有一些景區會將這些技術用於景區導覽；

l 高階的就是結合背景隨便掃（但還是要預先去調整），比較早的版本NOKIA當年弄過，現在蘋果主導的ARkit應該是這個方向，下圖舉例亞馬遜的AR應用：

（截圖自癮科技主站，圖中的鍋為AR生成）

微軟的Microsoft HoloLens, 算是MR(Mixed Reality), 微軟也推出了windows平台的MR就是windows MR，不過兩者之間存在一定差異。

（圖片來自微軟官網）

今年索尼的黑科技Xperia Touch，將投影跟手勢/觸控等相結合，是台探索各種交互可能性的設備：

（兩張圖片均來自SONY官網）

而有趣的是：隨著感測器技術、AI人工智慧、雲技術、智能硬體產業的發展，索尼在今年也復活了一款誕生於1999年的機器狗玩具：Aibo pet robot。

（圖片來自網路）

5. 雲技術，大數據也會在未來的交互趨勢里貢獻一份力量

比如亞馬遜最賺錢的項目AWS (Amazon Web Services)，可以提供最專業的大數據和雲計算服務以及雲解決方案。大數據這塊國內阿里、騰訊都投入了不少的資源，顯示出了大數據的重要性。類似滴滴、餓了么、ofo、摩拜、包括氣象等等，這種產生的大數據都具有相當大的價值，也會對未來的智能硬體和交互模式的優化起到幫助作用。

6. 其它

另外，有段時間甚至還出現了腦波交互和硬體體內植入等科技，但它們或許還需要經歷技術產品的打磨和道德層面的考量。這些產品能否上市，現在還不得而知。

以上就是我針對智能硬體的交互趨勢所想到的，可能不夠深入，但還是希望能幫到題主，以及引發大家的一些思考。

1991年，PARC的主管Mark Weiser在《Scientific American》發表了著名的文章《The Computer for the 21st Century》。他在文章中展望了未來的計算機技術，提出普適計算（Ubiquitous Computing）的概念，即計算設備將逐漸從人們的視線中隱藏和消失，而和用戶的日常環境和生活融為一體，讓人意識不到計算設備的存在。Weiser認為21世紀的計算機會融入網路、融入環境、融入生活，任何人都能夠在任何時間、任何地點、任何事件上（Anytime, Anywhere, Anything, Anyone）使用這些計算設備。因此未來的計算機變得更小和更廉價；同時這些設備永遠在線、超越傳統GUI的多通道用戶界面、能與人及環境進行主動的感知和交互。普適計算的本質在於提出新的計算機設計思維和人機交互方式，從而使計算機真正融合到人類社會的工作和生活中，象空氣和水一樣成為人們日常生活中無所不在的必需品。

智能硬體和交互技術的發展事實正如Weiser所預見的那樣進行。移動網路、雲計算、物聯網、語音交互、手勢交互、增強現實、可穿戴設備等等新技術和新設備的湧現，實質上是普適計算的載體和方式。在可預見的將來，智能硬體的發展仍將沿著Weiser設想的道路和方向發展，即更加微型化、依賴無時不在的實時網路和無所不在的感測器獲取數據、通過大量數據的實時採集和計算分析來實現設備與用戶之間的自然交互。

智能硬體更現實或正在進化的發展，可能是可穿戴設備、植入式硬體和腦機介面這樣的與用戶合成一體的方式。

智能硬體交互的趨勢，如果只是從現有技術條件下已比較成熟的手段來分析的話，那無疑，智能語音肯定就是其中主要的分析對象了。

歷史上的交互方式變遷這裡就不需再贅述了（例如從鍵盤滑鼠到觸摸屏等）；而語音交互其實在數年前乘著蘋果發布SIRI的的東風，就開始就越來越被了解和重視了。

所以，最簡單而基礎的，語音識別（配合語義理解）和語音合成這三項技術就能實現用戶與智能硬體之間交互溝通的橋樑。其中語音識別作為用戶交互指令的輸入端；而語音合成則作為機器對指令作出反饋的輸出端。

通過嵌入式晶元或者SDK集成的方式，智能硬體或應用就可以獲得靈活的語音交互能力。像科大訊飛這種業界巨頭已經有提供成熟的解決方案，新興起來的公司也不容小覷，像百度騰訊等傳統巨頭，還有像中國移動這種運營商（開放了靈犀雲能力）也提供了強大的語音交互能力支持。

@劉靖煌

備註：這是筆者在思必馳語音交互沙龍上的主題演講。整理成文分享之。

幾天前，微軟發布了一款同時支持智能電視和電腦的鍵盤，想要將人們拉回到視窗時代。智能電視需要鍵盤嗎?這是一個很有意思的話題。因為智能硬體來了，人類與設備的交互也迎來全新的變革，不只是智能電視。鍵盤、滑鼠正在退出舞台，觸摸屏尚有用武之地。整體而言，智能硬體的交互正在發生劇烈的變化。

一、智能硬體的移動特徵

智能硬體通過軟硬體結合，對傳統的設備進行改造，進而讓其擁有智能化的功能。功能無限擴展，產品快速迭代，進而擁有自動感知、自我學習的能力。典型的智能硬體領域有可穿戴、智能電視、智能家電、智能家居、車聯網、智慧醫療、酷玩設備、物聯網行業應用、機器人、無人機……

摩爾定律依然在發揮作用，晶元和感測器還在變小，電池密度在變大，對應的能力卻在增長。這使得智能設備可以不受限於體積，越來越小。同時，可以發現手機、平板、可穿戴設備在不斷變輕。每一代新產品都會標榜自己重量變輕了。

更小、更輕，結果便是智能設備更加便於攜帶。有的是穿戴式的（穿戴在人體或者物體上）、有的是可嵌入的（嵌入到人體或者物體）。還有許多智能硬體是組合式的，主機、配機、配件搭配使用，例如Nike+ Sport Watch以及許多運動教練設備。整體來說，智能硬體隨時隨地被我們所使用。

還有一個明顯的特徵是無線。過去，有人說移動互聯網，有人說無線互聯網——確實，很多設備並不能移動，但它卻收益於無線技術，例如友寶售貨機、無線路由器、智能電視。而智能硬體一個很明顯的特徵也是聯網，通過藍牙、WIFI、4G與互聯網連接起來。連接是設備智能的基礎。

受限於智能硬體的計算和存儲能力，其數據和計算是分離的，需要依賴手機、路由器或者雲，顯示交互則需要藉助手機、平板、PC、GoogleGlass，因為大量的智能設備根本沒有屏幕。

二、智能硬體時代的交互變革

人機交互是計算機領域一門博大精深的學科，已經經曆數代發展。

第一代人機交互為手工作業交互，使用者既設計者必須使用計算機代碼語言和手工操作的方法。此後先後出現了基於作業控制語言和命令行的交互，如Unix和CMD現在依然存在。接著GUI（圖形用戶界面）交互由施樂掀起、蘋果模仿、微軟普及，也就是我們正在使用的操作系統。WWW的出現則將我們帶入了WEB應用和客戶端程序的交互時代，IM、搜索引擎、門戶、社交網路等等。

現在我們進入了「智能X」的智能交互時代。未來的交互是什麼樣的？

可以看看剛剛過去的愚人節，互聯網公司做的幾場經典營銷。搜狗發布了Typany智能輸入環，豌豆莢發布了OneSpace搜索神衣，百度一口氣發布了三個產品：筷搜、Dulifre夢幻手環和4D視頻。雖然這些產品幾乎都無法在短期內面世，但它無疑代表了人們對未來的一種交互期望：更簡單、更自然、更高效。有人說，智能手機是人體的第六個感官。那麼智能硬體可能是人體的第七個、第八個、第N個器官。

三、從案例看智能硬體交互趨勢

從幾個已經存在的設備說起。

Fitbit Flex手環：沒有屏幕只有指示燈，通過敲擊與其互動。它可以隨時記錄運動情況和睡眠時間，形成一種「被動交互」。用戶除了可以在App查看數據和報表，還會收到任務完成的通知郵件。鬧鈴、任務完成和突破50公里之後，則會震動提醒。

GoogleGlass：智能硬體開拓者GG，也需要用戶通過敲擊、滑動、長按來啟動或者喚醒它，需要與手機這個網路樞紐連接。不過它多了兩樣交互：GoogleNow語音和視覺交互。你可以直接對GoogleGlass發號施令，如「顯示天氣」，你也可以對著它聯繫眨眼進行拍照，甚至你可以戴著它盯著一件衣服，它會告訴你品牌、款式和價格。Google採用卡片式的基於WEB應用。

智能電視：包括智能電視整機、盒子和影棒這些產品已經爆發，競爭十分激烈，今年將出現第一家出貨量超過100萬台的互聯網電視。智能電視不只是節目內容的變革，而是構建了一個客廳生態，內容革命、客廳娛樂和家庭應用。這些應用可以是信息消費、生活服務、家庭社交、娛樂遊戲和兒童教育，等等。

鍵盤滑鼠和觸摸屏都消失了，內容從換台發展到搜索、點選，人們的需求不再只是看節目，而是消費內容和使用電視App。智能電視對電視的全新定義帶來了新的電視交互方式。

這時候，遙控器要還是不要呢？現在不少智能電視或者盒子都有自己的專屬的極簡遙控器，或者乾脆只要手機App來遙控。同時會發現，語音交互成為智能電視標配，例如聯想最新發布的S50Air便搭載了具備語音交互功能的智能遙控器，因為客廳安靜、封閉，擁有高速網路，是語音交互親睞的環境。除了遙控器變革和語音的普及外，3D攝像頭的推出未來會影響到客廳娛樂、遊戲甚至搜索，實現體感動作、視頻監控等視覺交互。現在一些3D電視也為用戶配置了3D眼鏡或者頭盔，這是輸出的變化。

智能家居：智能電視實際上也可算作智能家居一部分，不過這裡指的是之外的，例如智能家電、安防、燈光等。智能電風扇、智能門鎖、WIFI插座、智能電燈和智能空調，它們有不少共同點：大都沒有屏幕，利用手機控制，支持遠程交互。下一代真正智能的家居則是可以感知環境和用戶，自動調整，真正智能起來。

智能汽車：智能汽車第一個聯想詞必然是Tesla，它用觸摸屏操控取代了汽車駕駛台五花八門的按鈕。與這種內置的系統不同更多是AppleCarPlay，基於iOS體系，需要藉助iOS設備完成任務，本質上還是智能手機的觸摸式主導，語音協助的交互。最前沿的當屬Google無人駕駛汽車莫屬，完全沒有司機了，它的用戶在雲端，可能就是基於大數據的自動調度系統，與汽車交互。

目前比較普及的則是基於汽車的應用。車機，裝在汽車裡的設備，或者在手機上的專為汽車環境設計的App。包括車載通信、娛樂、導航、車內環境控制、胎壓監測、後向服務、空氣監測等等。這些應用大都有一個共同點，支持語音，因為這可以解放雙手，便於駕駛員使用。不過它們卻為語音交互提出幾個要求：抗噪、可靠、簡單。汽車環境特徵、駕駛中的交互時間和容錯要求，與其他環境差別很大。

其他硬體：其他典型的智能硬體還有智能運動教練，嵌入到高爾夫球杆、球拍、滑板，意念控制的飛球、手臂；可以感知平衡的可編程Sphero飛球；酷玩應用、物聯網設備、智慧醫療等等行業，均能發現一些交互的共同點。

一些共同點：

1、鍵鼠和視窗消失，觸摸屏有少量場景。

不再前傾（PC時代）、不再後仰或低頭（手機時代），而是無處不在、姿勢各異的交互。

2、無需學習的自然交互。

擊打、晃動、體感、運動、語音、圖像，這些都是人類天生具備的能力。智能硬體被賦予生命，擁有與人類對話的能力。鍵鼠時代，每個人都需要經過一定時間的培訓才能使用。哪怕是智能手機的交互，打字也是基於QWERTY鍵盤的，觸摸也有學習的要求，只是時間短了些。

3、被動交互正在興起。

智能硬體很多沒有「離線」「關機」這些狀態。與智能硬體交互，很多時候不需主動「輸入」任何信息，用戶不會直接接受反饋，但依然完成交互。

例如我在走路時，在睡覺時，我的手環都在記錄我的信息；智能攝像頭隨時錄製家庭視頻；GoogleGlass也是與你生活融入到一起，隨時與你交互。

4、協同交互：

用戶要麼需要藉助手機App或郵件系統，要麼需要藉助遙控器，要麼需要在雲端遠程控制。當然，很可能是幾種交互方式並行。總之不再通過單一界面與系統交互，而是多屏幕、多媒體、多渠道的交互方式。

基於此，雷科技總結了智能硬體交互趨勢：

1. 智能交互時代：PC和智能手機讓位，忘掉過去的交互準則。

2. 手機依然是中心：App要面向智能硬體重新設計。

3. 面向無屏和多屏的交互：未來屏幕無處不在，按需存在。

4. 雲+端的交互：遠程控制、WEB OS、卡片應用、HTML5。

5. 多媒體交互：動作、語音和視覺。動作成熟，語音趨於成熟、視覺尚需時間。

6. 個性化交互：LBS、時間空間維度的交互記錄，大數據，個性化交互。

智能硬體交互要真正智能起來，還有不少挑戰：

連接是基礎：藍牙、WIFI、4G、紅外以及定位，這些技術還在發展之中，有些是瓶頸如4G；感知是能力：感測器、重力感應、壓力感應、聽、看，這些能力讓硬體智能起來，還有一些感知還很不完善如味覺、嗅覺。智能則是最大的挑戰：

1、技術成熟度：機器學習、深度學習、自然語言理解、語義理解、人機對話、需求預測、數據挖掘這些技術尚處於早期。在足夠智能之前，智能水平與用戶體驗、可靠性的矛盾。

2、智能化成本：不是所有開發者都具備智能交互的能力，第三方智能平台開放程度、模式和成本影響普及。

3、用戶習慣：大家都認為搜狗輸入法比五筆更加先進，但依然還有人在使用五筆輸入法，習慣使然。同樣，智能比傳統交互更好，需培養用戶習慣，非一朝一夕，需要時間。

智能交互，用戶接納、廠商支持、技術發展是相輔相成的。以語音為例，最近幾年語音玩家多了起來，有語音巨頭，有互聯網巨頭，也有創業團隊。大家都在不斷改進提升自己的技術，並且將能力通過多元的方式分享給業界，甚至是完全免費。廠商將語音作為標配之後，即可以培養用戶習慣提升市場需求，又可以為廠商提供語料數據幫助廠商升級技術，形成良性循環。視覺、體感等其他領域的智能交互或許也會走類似的道路。

下載PPT請移步至雷科技。

本文分享至雷科技，以自問自答的形式拋磚引玉了，歡迎大家分享。智能硬體掀起交互革命

幹掉屏幕。

是身體的衍生品，然後GUI可能就沒什麼活好乾了

人會越來越懶，基於這個前提，所有的設想都是合理的。

打字麻煩，能不能語音交互？

語音交互還麻煩，能不能用眼球直接交互？

眼球還麻煩，能不能用腦電波直接交互？

腦電波交互還麻煩，能不能機器人深度學習，知道我想幹嘛不就得了。

所以，你看。

硬體，總要說說是什麼硬體。

智能內褲和智能衛生巾，操作方式肯定有不同；

智能水龍頭和智能炒菜機，操作方式也會有區別。

智能雞婆鞋，大概會在每天早上七點鐘準時打鳴，然後穿上你的腳，帶你翱翔帶你飛；

智能馬桶，大概會在你想便便前15秒預熱，然後協同智能雞婆鞋，運你到廁所；

智能擦屎機，大概會在你便完後，幫你揩乾凈，再按摩按摩，放鬆肌肉，美好生活。

那麼，問題來了，什麼是最好的交互方式呢？

下策為：用手點，設程序。太低端，太low。

中策為：心有靈犀一點通。這個好一點點。

上策為：它比你，更懂你；它，超出十倍預期滿足你。

語音交互。

京東和語音交互水平國際領先的科大訊飛合資打造的靈隆科技有限公司，這麼一長串大家肯定沒什麼感覺，在15年的烏鎮互聯網大會和2016的AWE，驚艷亮相的叮咚音箱就是靈隆科技的主打作品。為什麼他會吸引了這麼多人的目光？人機交互最low的方式是什麼，D妹認為是點點點，而叮咚音箱將會改變這一切！叮咚音箱現在與京東的智能家居平台京東微聯開展合作，將智能家居的控制權由手轉交給了嘴，解放雙手就是這種意思。

好了好了，我聽到很多人說叮咚copy 亞馬遜echo，但是so what ？！叮咚現在已經打通了智能家居這條路，echo並沒有，叮咚只是把localize得比echo好

手機碼字，簡單說幾句。

我心目中的智能概念沒什麼創新，就像別人已總結過的：智能硬體是有別於其他機械電子設備，能通過接收信號，基於一定的演算法/數據做出響應的。

現在的交互似乎越來越靠向利用人體生理特徵做被動交互了。比如面部識別，動作識別，指紋識別……未來也許也是向這方面發展吧，儘可能讓人減少操作步驟和難度，少想少記，任何年齡智商都能無障礙使用，我還比較嚮往哈。

我的答案是：主動式交互。

在pc時代（包括台式機，筆記本，超極本/變形本等），在手持時代（包括pad，手機等），我們的交互是用戶發起，機器反饋，對於機器來說，這是被動式交互——有輸入才有輸出。

在將來，人機交互將是：主動式交互——機器不再是被動聽命者，ta能主動感知您的存在和身份，並以某種帶情感的表現形式存在（產品表現形式為：男/女娃娃或桌子或冰箱或門窗乃至車船等等），主動為您提供服務（消息提醒，處理事情，甚至整理規劃將來的事情），你作為一個「享受者」，以夥伴或主人的方式存在於硬體設備中並且被關心和呵護著。

可能是英劇《黑鏡》里描述的樣子吧，那是觸手可及的未來。