你好,若琪!你讓我們看到了家庭人工智慧,不僅僅是一個外表溫潤的機器人
它能夠認真聽懂並完成你指示的任務,在被調侃的時候,它能以恰到好處的調侃回應你,它不僅僅是一個「有性格」的家庭機器人,還是一個智能家庭終端。它的名字叫做 Rokid(若琪),背後是一家由前阿里巴巴 M 工作室領頭人 Misa 創建的公司——芋頭科技。
在最近一期的「深圳灣夜話」活動中,Rokid 市場負責人黃超(大黃)與 Rokid 的天使用戶、深圳市華百安智能技術有限公司副總經理陳石一同做客深圳灣,與在場的夥伴們聊了聊 Rokid 產品背後的故事,以及家庭人工智慧(Home AI )、智能家居、家庭機器人等話題。
聊產品 :
Rokid 的誕生,從童年的機器人玩具到年輕人的大玩具
說到 Rokid 家庭機器人的來源,不得不提及它的產品創始人 Misa。Misa 自小在美國長大,像大多數美國小孩一樣痴迷於《星球大戰》,擁有一台自己的 R2D2 機器人成為他兒時的夢想,而後來不管讀博士還是工作,Misa 的個人經曆始終與機器人有著諸多聯繫,這也為 Rokid 的誕生做了鋪墊。
當 Misa 在跟團隊提起 Rokid 這樣一個項目時,以當時的人工智慧還沒有像現在這樣進入井噴時期,最初給 Rokid 的定位是年輕人「大玩具」,讓忙碌一天的都市白領回到家中能有一個陪伴者,替他們完成他們懶得做的事情,還能陪他們聊天、唱歌......於是,給喜歡這種產品的人提供良好的生活體驗成為了團隊做這款產品的初衷。
Rokid 的用戶定位中高端人群,這類人群一般有兩個特點:一是普遍喜愛科技特有的未來感;二是熱愛生活、有品位。這類人群享受的不只是單純的高科技,更是科技帶來的良好生活品質。這也是為什麼 Rokid 團隊十分注重用戶體驗的原因,Rokid 希望用戶在使用它的過程中感受不到科技本身的存在,而是感受到科技帶來的良好體驗。
產品沒有一顆螺絲釘,外觀溫潤的 Rokid 即便是到了專業「肢解產品」的團隊手裡,也真心不捨得拆!
作為 Rokid 的 300 名天使用戶之一,陳石認為,相比於滑鼠、鍵盤輸入等,自然語言的交流才是最好的人機交互方式,並且語言的交互不應有邊界。在這一點上,Rokid 達到了他的預期。
在將 Rokid 拿到手之前,陳石曾一度企圖像「外科醫生」一樣將它拆解開來研究其中的結構和技術。在夜話的聊天中,這個行為被戲稱為「大深圳人」的地域嗜好,深圳的產業基礎,讓這些專業人士執迷於任何一款「現象級新品」的拆解研究。然後,產品到手後,陳石發現,在 Rokit 圓潤的外表下,沒有找到一顆螺絲釘,而 Rokid 溫柔知性的語音問候,以及炫美的投影,讓他實在沒有忍心做這個拆解。
Rokid 官方為了不讓這 300 個天使用戶動「外科手術大夫」的念頭,專門錄製了視頻,公布產品內部工藝結構。這個舉措,也讓 Rokid 的天使用戶群里的很多人,更加佩服 Rokid 的結構工藝。而從另一個層面,相比較硬體,Rokid 更看重的是產品的「軟體」屬性,Rokid 希望用戶多多體驗和研究 Rokid 的語音交互等軟性能力。
· Rokid 內部構造圖
前所未有的交互體驗,Rokid 看起來不像是冰冷的機器人
Rokid 團隊在產品和交互方面可是下了許多的功夫。產品外觀上,採用高曲率的非球面殼體、准 3D UI、藍色圓環燈(內嵌 40 顆 LED 燈)。盯著 Rokid 顯示面板的時候,並不會感覺它的燈光刺眼。
而對 Rokid 性格定義,是一個沉穩優雅,甚至有些高冷的女性機器人形象,在完成任務之外,它也有自己的脾性,不會像其他某些家庭 AI 一樣聒噪,不停用讓人厭煩的固定的交互方式打擾用戶。適當的交互頻率和內容使得 Rokid 不再是冷冰冰的設備,而是人類的好朋友以及生活助手——這樣才能讓人有跟它進行交流的意願。
聊技術 :
自主進行了大量的技術研發的 Rokid,在技術應用上卻格外慎重
從產品設計初始,Rokid 團隊就希望 Rokid 在視覺上和聽覺上都能給人以一種良好的體驗——將顯示和燈光融為一體,能夠呈現出柔和的燈光,為了實現這樣的效果,Rokid 團隊與合作夥伴共同就面板和 DLP 技術研發了一年的時間。
在深度學習方面,許多企業為了能夠迅速發展,一般都會藉助第三方研發的技術。而同樣作為初創公司,Rokid 基於的聲紋識別、人臉識別、手勢識別、源場語音識別、聲音尋向、AEC 自身音源消除等技術,全都由團隊自主研發。包括杭州、北京、灣區等地在內的 Rokid 研發團隊已將近 100 人,其中大部分都是資深的工程師,包括中科院最早一批做語音識別、圖像學習等的技術人員和顧問。
對於技術的應用,Rokid 團隊有著自己的理解,大黃說,技術僅僅是工具,只有放在產品上能帶來更好體驗時才有意義,而不能為了標榜技術優勢而在產品上堆砌技術。Rokid 的做法,是結合內容和具體的應用場景,逐步進行技術的應用和升級,帶來體驗的提升。
關於 Rokid 上應用的深度學習技術,曾攻讀人工智慧碩士的陳石提出了疑問:深度學習需要大量的訓練模型,而對於 Rokid 這樣一個初創團隊來說,數據訓練更是一個大「坑」,他們又是如何解決訓練量問題的呢?
大黃回應說,Rokid 主要通過三方面進行數據採集:初期 300 名天使用戶的使用的數據採集;將工程樣機提供給外部人員使用,如大學等,在貼近生活的現實場景中採集數據;團隊成員中有許多深度學習領域的資深人士,本身在這個領域就有大量積累。
追求極致,採用高難度的二音節喚醒詞
對於人工智慧機器人,業界普遍採用三音節、四音節喚醒詞,而 Rokid 偏偏採用了更具挑戰性的雙音節喚醒詞,大黃解釋了其中的原因。
喚醒詞的設定是產品的一個必定步驟,因為喚醒詞具有屏蔽的功能,就如同呼喚人名一個道理。二音節喚醒詞的難度在於容易出現無法激活或誤激活的情況。按照中國人的習慣,採用三音節顯得太過正式,不太符合 Rokid 這樣一個「家庭成員」化的使用場景。Misa 對產品的極致追求以及公司的文化——在每個應用中挑戰行業的技術極限,促使他們將二音節的技術壁壘攻了下來。
在功能性和情感關懷上做選擇,就像兩條腿走路
活動現場有深圳灣的小夥伴提問:在 Rokid 的產品研發過程中,團隊更注重其功能性,還是更傾向於把它定位為一個情感工具?
大黃說,很多人會認為家庭機器人是一個沒有太多實際功能的產品,但我們相信,它的發展就如同手機的一樣,起初局限於網路等配套設施,人們並不會想到讓手機去做過多的事情,而當整個手機行業起來後,手機各項功能也就自然而然會得到完善。
同樣的道理,人們對情感的需求不會減少,我們首先要做到的是讓用戶在語言交互的基礎上,能夠有更順暢的體驗,把基礎應用做好並不斷完善,才進一步根據用戶習慣推出細分、個性化的應用,就是所謂的「用兩條腿走路」,後腳要跟上前腳的步伐。
聊生態 :
智能家居不慍不火,Rokid 有望帶動智能家居行業?
Rokid 不僅是一個家庭機器人,它還是一個智能家庭終端,已經與 Lifesmart 等智能家居品牌合作,以配合滿足用戶在日常使用場景下的更多需求。
Rokid 提供的是一個開放的平台,能連接藍牙、WiFi、紅外等各種標準,在大黃看來,這些協議各有各的優勢,而 WiFi 將是家庭連接的主流方案,Rokid 團隊也曾經有推出面向智能家居合作夥伴的 SDK 計劃,讓 Rokid 成為一個連接器。
作為智能家居的從業者,陳石表示,就目前的情況看來,通過一兩家公司的推動,是很難將整個智能家居行業帶動起來的。而智能家居不溫不火的氛圍並不足以支持 Rokid 的開發,但他認為,Rokid 具有明星產品的潛質,很可能反過來帶動智能家居行業的進步。
在交流中,大黃表達出了自己對智能家居以及 Rokid 的四層創想:第一層是對控制、命令的完成,如完成對燈光、電視、空調等家電的控制;第二層是場景化的響應,如在主人回家、舉辦 Party 的情況下,自動營造合適的場景;第三層是主動溝通,如預知下雨天的情況下,在主人出門時主動提醒其攜帶雨具;第四層是物聯網系統的連接,比如讓冰箱識別出其中所欠缺的食物,並通過互聯網進行網上下單,能讓快遞將貨物及時送上門,保證食物的供應。
全新的交互方式之下的內容生態
目前,Rokid 已有了許多內容合作資源,如書本、影音、繪本等。具體的合作方式與手機的開放平台類似,讓開發者基於系統去開發應用,只不過 Rokid 通過不同的交互方式來展現應用。Rokid 團隊將其基礎體驗做好之後,其編程、開發進程也相對更簡單、快速。
至於 Rokid 的二次開發方向,大黃表示他們更傾向於生活化的家庭應用,如英文學習、算數、菜譜等。「人們一旦擁有了科技之後,就越來越不會覺得它是一件新鮮事物,而我們能努力的方向是,讓科技給人們提供更好的體驗,讓產品具有開放性和升級迭代的可能性。」大黃如是說。
Rokid 目前尚未公開發售,如有意成為 Rokid 的天使用戶,請微信留言給我們。
原文鏈接:http://www.shenzhenware.com/articles/10913
版權聲明:本文系深圳灣編輯創作發布,轉載請註明來自深圳灣,並標明網站地址 shenzhenware.com轉載、約稿、投稿、團隊報道請聯繫微信公眾號:shenzhenware(回復關鍵字)推薦閱讀:
※度秘想要悄悄進入客廳,而且上來就把目標設在了5000萬
※教你搭建你自己的「深度學習」機器
※首款人工智慧鑒包神器,從此不怕買到假包包了!
※《銀翼殺手 2049》的複製人與《西部世界》的 host 對比,誰會更勝一籌?
※在英特爾與阿里云為之站隊的「 DE 超聲機器人」背後,是人工智慧+醫療的廣闊前景