圖靈郭家:如何打造兒童喜歡的智能產品?這個問題可以通過 AI+IP 模型來解答 | WARE 2018

圖靈郭家:如何打造兒童喜歡的智能產品?這個問題可以通過 AI+IP 模型來解答 | WARE 2018

來自專欄 深圳灣 | shenzhenware

成立 8 年,聚集 70 萬應用開發者,聚焦兒童領域 AI 應用,圖靈不僅僅是「阿蘭·圖靈」的那個圖靈,圖靈還是全球最大的中文語義技術公司,其 AI 技術已經幫助國內 TOP50 的兒童產品品牌實現了語音交互和智能化內容輸出。

無論是圖靈和日本夏普合作的 RoBoHoN 機器人、Sphero 新品,還是和電影『蜘蛛俠』一起上市的會說話的蜘蛛俠,以及迪斯尼 AI 劇本專利,我們都能發現,AI+IP 也是國際上兒童產品的趨勢。

在深圳灣「WARE 2018 新硬體峰會」上,圖靈機器人聯合創始人郭家分享了圖靈在兒童領域的 AI 應用探索和思考,並深入闡述了「AI+IP」模型如何幫助兒童智能產品實現影響力和智能化服務價值輸出。

IP = 影響力(粉絲流量)+ 消費力(粉絲轉化);AI = 多模態交互技術 + 智能化服務價值輸出。

郭家和我們探討了「兒童喜歡玩什麼」的話題。同樣都是機器人,無論是從銷量還是用戶的喜愛程度來看,Jibo 比起超級飛俠都差的很遠。對於兒童來說,喜歡哪個不喜歡哪個,產品從外觀和表現力上就已經非常明顯了。

而在 AI 應用上,通用的 AI 是遠遠不夠的,需要通過多模態人機交互,實現 IP 角色定製化,再依據 IP 角色定製內容輸出。比如,當我問「你有去過巴黎嗎?」,如果是小豬佩奇就會回答,「法國就在我們隔壁,我經常去」;如果是超級飛俠就會回答,「我本來就會飛,想去哪裡就去哪裡」。

AI 天然自帶一種人格屬性,它就是一個有生命的機器人。而多模態交互能讓 IP 角色更加豐富,以滿足兒童豐富多彩的夢想。在此基礎之上,圖靈再為產品加入智能化的內容和服務,就可以幫助兒童產生對學習更大的樂趣。

以下是郭家演講實錄,經深圳灣整理和發布。


演講嘉賓:郭家 / 圖靈機器人聯合創始人;演講主題:兒童智能產品的 IP 與 AI 交互

大家好,我是圖靈的郭家。今天跟大家分享一下圖靈 AI 在兒童領域的應用探索。

幾天前,艾瑞諮詢發布了一份 AI 領域的分析報告,分別從橫向和縱向幾個維度解析了人工智慧產業:橫向維度包括基礎設施(如晶元、感測器、數據)、行業應用場景(如工業、金融、教育)等,縱向維度則是按照技術歸類劃分。

圖靈從中發現,其實每個產品都可歸類於這三大類技術:語音辨識與合成(ASR/TTS)、語義理解(NLP)、機器視覺(CV),這也是目前人工智慧領域三大主流技術框架。

成立 8 年,聚集 70 萬應用開發者,聚焦兒童領域 AI 應用,圖靈不僅僅有一個好名字

「圖靈」(阿蘭.圖靈)是鼎鼎大名的計算機之父、人工智慧之父。「圖靈」又是我們早在 2010 年公司開始探索 AI 方向時就註冊的品牌名。我們在 AI 大潮襲來之前,就開始開發 AI 語音對話應用,那時候還是 App,之後又在業界率先推出了機器人操作系統。

圖靈專註在 AI 語義技術開發多年,現在已經在全球積累了 70 多萬開發者,這個數字每天都在增長和活躍。自 2015 年開始,圖靈在兒童領域逐步與國內 TOP10 的企業達成合作,包括大家耳聞能詳的步步高、火火兔、奧飛、讀書郎、快易典、名校堂、KIDO 等。

圖靈已經成長為全球最大的中文語義技術公司。

讓兒童與機器的交互更自然,要看哪些關鍵指標?這裡有圖靈的一組研究

在語音語義交互領域有哪些關鍵的指標呢?這張幻燈片展示了圖靈的研究成果。在眾多指標里,ASR+NLP+TTS 速度、意圖解析準確率、知識庫、語料庫,這些標註黃色的部分,是客戶及用戶層面非常關注的數據。

進一步闡釋,這張圖的左邊是我們最看重的演算法類指標,包括語音和語義的交互數據、分詞準確率、意圖解析準確率、NER 準確率等。

其中,在交互速度方面,拿 Echo 的語音交互數據做對比,從用戶說話到 Echo 反饋結果,平均耗時 1.5 秒。我們也測了很多國內的產品,有的比 Echo 還要更快,這是特別重要的一個指標。

意圖解析是指,當我們向機器問一個問題,機器能不能回答好,其中評價的指標包括兩部分:第一部分是正確的理解、聽懂你的意思;第二部分是找到合適的答案給到你。所以意圖理解是非常重要的環節,也是各項 AI 國際賽事主要 PK 的指標。

AI 技術的本質是演算法+數據,數據的積累往往可以成為一家公司的門檻。我特別認可這樣的說法——所有的互聯網公司都會變成數據公司,所有的數據公司都會變成人工智慧公司。所以數據儲備指標,對於語音交互的評估至關重要。為此,圖靈也在積累兒童音視頻資源。

三大技術能力,打造面向兒童硬體設備商的 AI 方案

前面有提到圖靈已經和國內 TOP10 的企業達成合作,其中包括小米。今年 3 月,圖靈和小米兒童產品已經全面展開合作,小米智能手錶、故事機等小米生態鏈產品,都採用了圖靈的 AI 技術。而在 3 月 27 日小米新品發布會上,雷軍宣布小愛同學不僅被植入進了小米電視,還植入進了小米手機,而其中的兒童對話部分,就有圖靈的技術支持。

圖靈面向兒童硬體設備商的 AI 技術方案包括三大方面的能力:

  • 語音對話:閑聊型/知識問答型/技能任務型
  • 兒童內容點播:音樂/故事/教材/動畫
  • 家長端:遠程交互/設定提醒/數據管理

這些不僅僅是 PPT 的能力,更是圖靈已經賦能 TOP50 兒童品牌後驗證和訓練出來的能力。

圖靈的 AI+IP 模型:IP 建立影響力,AI 智能化服務輸出價值

我們看這樣一組數據:白色的這款是由 MIT 科學家們打造的明星產品 Jibo 家用社交機器人,紅色的這款是奧飛旗下樂迪超級飛俠兒童機器人。目前,無論是從銷量還是用戶的喜愛程度來看,Jibo 比起超級飛俠都還是差的很遠。這其中的原因不言而喻,對於兒童來說,喜歡哪個不喜歡哪個,從外觀和表現力上就已經非常明顯了。

圖靈認為,IP = 影響力(粉絲流量) + 消費力(粉絲轉化)。首先,要有足夠的流量建立影響力,就像明星要經常走秀才能出名;然後,接廣告變現,粉絲消費變現,在動畫領域的一些兒童 IP 已經有這樣的價值了。

圖靈認為,AI = 多模態交互技術 + 智能化服務價值輸出。AI 的價值體現,首先是在技術層面,產品層面實現了語音、視覺、機械控制等,其次在智能化層面,不斷為用戶輸出內容和服務。

基於此,圖靈構建了自己的 AI+IP 模型。

將 AI 與 IP 融合,把技術融合在構建影響力這個層面,去吸引足夠多的粉絲,然後在消費力層間,持續的輸出智能化服務的價值。

光有通用 AI 還不夠,圖靈通過多模態人機交互,實現 IP 角色定製化

圖靈在對目標客戶的研究發現,擁有 IP 的設備廠商,對於通用的 AI 並不感冒,他們往往都會有進一步的 IP 角色定製化需求。

圖靈為客戶定製的個性化多模態交互,包含四大部分的功能:IP 屬性個性化、IP 音色個性化、IP 動作個性化、IP 表情個性化。展開來論述:

  • IP 屬性:提供屬性定義工具,定義機器人的姓名、年齡、性別、父母等
  • IP 音色:用 WaveNet 生成模型,做全球最好的 TTS 合成引擎
  • IP 動作:用語義串聯動作,讓機器人說什麼話做什麼動作
  • IP 表情:用情感計算識別的情感類型和程度,映射機器人的表情

目前市場上主流的 TTS 技術生成的童聲,機器聲音的痕迹還非常明顯。今年年初,AlphaGo 團隊開放了一個最新的 TTS 技術——基於 WaveNet 卷積神經網路的 Cloud TTS,我們在這一基礎上進行了音色定製和優化,製作出來的童聲,音色的圓潤程度遠遠比市場現有 TTS 音色的圓潤程度高,能做到和人物原聲相似度達 95% 以上。(現場演示聲音對比,秒殺效果令全場觀眾稱讚。)

這裡值得一提的是,清華大學 Aminer 團隊不久前發布了一份報告,報告顯示,圖靈兒童 AI 專利數為同類專利總數的 62%,多模態交互專利全球第二,AI 專利總數則是全球第四。

光有單一的 IP 還不夠,圖靈幫助品牌方實現智能化的內容和服務價值輸出

接下來講一下 AI+IP 模型中的智能化服務,分三方面闡述:

第一,建立獨立記憶系統。在圖靈語料總庫的基礎上,讓機器人學習並記憶每個用戶不同的個性化數據。例如如果能持續記錄用戶的個人習慣,並做出相應的個性化調整,這能使得產品有更深的粘性。

第二,定製語義技能。圖靈除了提供 AI 技術方案,也是 AI 的應用開發者,我們為優質合作夥伴定製自有資源的 AI 技能、知識圖譜等。

第三,劇本式話題。根據動畫片的劇本,生成每個 IP 獨有的話題。例如,圖靈與小豬佩奇、超級飛俠等 IP 合作,我們訓練出來的內容與其他 AI 訓練出來的內容不一樣。當我問它,你有去過巴黎嗎?如果是小豬佩奇就會回答,「法國就在我們隔壁,我經常去」;如果是超級飛俠就會回答,「我本來就會飛,想去哪裡就去哪裡」。

響應客戶的需求,圖靈還對大量兒童課本教材做了 AI 內容和服務輸出。

AI+IP 是國際大趨勢,兒童智能產品應該是小朋友的夢想載體

無論是圖靈和日本夏普合作的 RoBoHoN 機器人、Sphero 新品、還是和電影『蜘蛛俠』一起上市的會說話的蜘蛛俠,以及迪斯尼 AI 劇本專利,我們都能發現,AI+IP 也是國際上兒童產品的趨勢。

圖靈做了大量關於「兒童喜歡玩什麼」的調研。這些都是我們的實地調研:墨西哥的這位男孩喜歡小汽車,義大利的這位女孩喜歡各種公主裙和芭比娃娃,這個美國男孩喜歡飛機,這個中國男孩喜歡槍和炮。

兒童喜歡玩什麼?答案抽象出來,就是給他一個夢想的載體。以上四組分別體現了小朋友的駕駛員的夢想、公主夢想、飛行員夢想、以及當一名戰士的夢想。

小結一下:AI 天然自帶一種人格屬性,它就是一個有生命的機器人。而多模態交互能讓 IP 角色更加豐富,以滿足兒童豐富多彩的夢想。在此基礎之上,我們再為產品加入智能化的內容和服務,就可以幫助兒童產生對學習更大的樂趣。

以上就是我的分享,謝謝各位!


深圳灣(公眾號 ID:shenzhenware)連接全球硬體創新者,連接硬體生態鏈上下游,連接跨界產品的設計、技術、生產、渠道、商業、創新。深圳灣持續關注「AI+硬體」帶來的場景和交互創新,以及與平台和應用相連的全產業鏈升級,歡迎相關團隊與我們聯繫,微信私人客服:小炫(ID:warexx)。


推薦閱讀:

TAG:圖靈AlanTuring | 人工智慧 | 兒童玩具 |