阿里AI智能音箱現在有了視覺能力,跟人交互時表情豐富
安妮 發自 751D·Park
量子位 出品 | 公眾號 QbitAI
昨天,在阿里巴巴2018年春季發布會上,阿里AI實驗室推出了第二代中文人機交流系統AliGenie 2.0,在「聽」和「說」的基礎上引入了視覺能力,搭載AliGenie 2.0的「精靈火眼」功能也同時亮相。
此外,天貓路由、天貓魔屏S1和天貓精靈曲奇三款新品也一同面市。
AliGenie 2.0
距離去年7月發布搭載了AliGenie的天貓精靈X1已八個月有餘,銷量怎麼樣了?阿里AI實驗室負責人淺雪表示已經賣出了200萬台。
和以往不太一樣的是,此次推出的AliGenie2.0具備了視覺的能力,能夠進行視覺認知、多模態交互、情景感知。
AliGenie 2.0首先將視覺能力落地在天貓精靈X1上,通過具有天貓精靈手機APP實現「精靈火眼」功能。
此外,阿里AI實驗室還推出了一個可以戴在天貓精靈X1頭上的「帽子」XHolder,以便將手機放在XHolder支架上捕捉圖像,同時手機還會顯示出一對大眼睛。
對了,XHolder目前售價為49.9元。
核心功能
精靈火眼的核心能力有兩個:「視覺認知」和「表情系統」。
表情系統是指基於3D虛擬形象,提供自然交互的表情擬態動畫,目前包括近20多種擬態動畫。通過App的屏幕觸摸它的鼻子眼睛或額頭,能得到不同的反饋,還能看到它生氣或撒嬌的樣子。
視覺認知主要面向兒童,精靈火眼通過圖像識別,結合智能語音互動、聲音朗讀,幫助兒童讀書、識字。
目前,阿里AI實驗室已經聯合中國少年兒童出版社、安徽少兒出版社等國內頂尖的出版社,選擇了適合3歲到8歲兒童的117套圖書,兒童只需將繪本展示給天貓精靈,即可聽到有聲版的故事。
此外,老年人也是精靈火眼的一大受眾。阿里AI實驗室開發了識別藥盒的功能,與阿里健康合作,能夠識別4萬種藥盒。只要用精靈火眼掃一掃藥盒,就能用語音播報藥名、功效、過期日等信息。
未來,阿里AI實驗室還將計劃引入萬物識別、人臉識別等功能。「我們今天推出的精靈火眼功能,也只是視覺功能的開始。」阿里人工智慧實驗室產品總監釋空在接受採訪時說。
這裡還有一個插曲。
在現場演示精靈火眼功能時,天貓精靈還一度沒有聲音,只有兩隻大眼睛做著各種各樣的表情。在程序員「祭天」回來的二度展示時,聲音才恢復正常。
新品三連發
除了精靈火眼外,此次發布會還推出了阿里AI實驗室的三款新品。
天貓路由售價199元,是一個「沒有觸角」的路由,天線為隱形設計,不同Wifi熱點之間無縫切換。
天貓魔屏S1是一個可以聯合天貓精靈聯合使用的投影儀,最大投射屏幕300吋,售價4699元,以後在家裡就能享受巨幕效果了。
天貓精靈曲奇是個Q版的智能音箱,身高只有天貓精靈X1的一半,目前預售價為299元。
可以發現,這三款新設備,剛好是人機交互的「輸入設備」,「鏈接設備」以及人機交互的「輸出設備」。阿里方表示,輸入/連接/輸出的智能化這是AI實驗室對智聯網的三個關鍵組成部分的理解。
「我們生活在一個工業時代跨度到數字時代的過程,我們今天可能沒有辦法改變一個藥盒的外觀,但是我們可以改變一個藥盒的瀏覽方式,這就是人工智慧實驗室想為我們這個世界帶來的一點點愛。」淺雪說。
— 完 —
歡迎大家關注我們的專欄:量子位 - 知乎專欄
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。
量子位 QbitAI · 頭條號簽約作者
?? ? 追蹤AI技術和產品新動態
推薦閱讀:
※別了!又一個巨頭,墜落了!
※危險的阿里巴巴
※阿里千億營收的背後玄機和野望
※當時代拋棄你時,連聲再見都不會說
※邱清榮:阿里巴巴的合伙人制到底是怎麼一回事?