這次,羅永浩一句人工智慧也沒提
羅振宇:有沒有人認為羅永浩是一個外行?
羅永浩:第一代硬體發布會的時候,有人說你懂個屁手機,你還是說相聲去吧。今天我出去聊手機沒事,如果有人找我去聊人工智慧,外邊就有人就說你懂個屁的人工智慧,你還是做你的手機去吧。
羅永浩這次一句「人工智慧」也沒提。
上周,鎚子科技新款手機發布。照例,有褒有貶。關於手機本身,量子位不想過多評論,我們更關心期間展示的一些人機交互方式。
羅永浩談論的很多「軟性」賣點,招招式式全跟AI有關。
這位鎚子科技創始人的觀點是:如果一個全知全能的「語音助手」還不能實現,那就先通過工具性產品提升用戶效率。
去年10月,也是鎚子的一場發布會,突然讓科大訊飛火了一把。這次鎚子新品背後,又是哪些人工智慧公司在支撐?
AI夥伴
在堅果Pro發布會上,鎚子科技在手機上的AI變革,一目了然。
首先可以從系統層面來看,鎚子的打法是通過系統功能,讓鎚子手機用戶在具體場景中體驗更好、效率更高。其次是工具性產品打造,通過工具性產品,解決用戶核心痛點和改善用戶體驗。
這些應用的背後技術方案提供商,也無一例外來自人工智慧領域;而軟體交互方面的創新,都與人工智慧最新進展密不可分,在此量子位一一拆解挖掘:
1)簡訊退訂
「簡訊退訂」背後的技術提供商是小源科技,這是一家垂直於簡訊、利用語義分析場景、建立機器模型的公司,他們更加為人所知的產品名稱是「信析寶」,主要應用形式是將航班信息等簡訊卡片化——更美觀、更實用、並且可以直接跳轉到相關App。
不過,這一次放在鎚子科技發布會上展示的是「簡訊退訂」的問題,這是目前簡訊騷擾最頭疼的問題之一,而鎚子和小源的結合,則為功能式解決首開案例。
小源科技負責對外戰略合作的合伙人段旭告訴量子位,「簡訊退訂」背後主要涉及的是「自然語言理解」和「場景識別」等兩大內容。
首先是「自然語言理解」,即通過機器「讀取」簡訊內容,判斷簡訊內容、類型和所屬場景。
其次是「場景識別」,需要判斷簡訊是一般退訂簡訊,還是帶有通知內容的退訂簡訊,再在用戶最終決策後,一鍵完成退訂,並且不會給發送簡訊方造成「回復證明活躍」的現象。
小源方面稱,這背後是簡訊內容大數據的積累,以及內容場景模型的精準構建。
2)虛擬來電
「虛擬來電」是發布會會中和會後受到爭議的功能,在「道德與否」的問題上,引發了廣泛討論。然而就技術而言,這已然是人工智慧領域相對成熟、且被廣泛應用的技術。
具體提供商方面,鎚子引用了科大訊飛的「配音閣」,這是訊飛主打語音合成方案的平台名稱,該平台可以按需提供個性化語音合成,能夠通過簡單而基本的語料信息,合成具體語言、具體語種和具體個人口音的語音信息。
更早之前,在鎚子科技去年10月的新品發布會後,科大訊飛的「配音閣」已經在鎚子科技系列新品發布會前後大放異彩,主要是通過合成羅永浩、奧巴馬等的口音,實現機器語音的「個性化」。
值得注意的是,雖然鎚子科技功能化產品「虛擬來電」受到爭議,但該技術的實際應用卻廣泛得多。
比如現在不少快遞企業,已經在通過「虛擬來電」的方式,讓機器來通知物流快遞信息,而一些售後和客服任務較重的行業,也已經上馬了該技術。
這也是客服行業和配音行業正在經歷的大變革。
除了科大訊飛,宣布AI轉型的百度也在這方面秀過肌肉,在2016年百度世界大會上,李彥宏就展示過人工智慧充當客服帶來的效果,不僅成本降低,而且準確度,以及對用戶非結構化數據的整合方面,效果都極其明顯。
此外,就著當紅演藝明星胡歌的面,李彥宏還讓機器模仿胡歌的「口音口吻」,除了感情色彩上稍遜一籌,已屬惟妙惟肖——李彥宏說,人工智慧正在搶走配音師的飯碗。
3)智能語義拖拽
當然,鎚子發布會聽起來最具普惠意義的莫過於「智能語義拖拽」,這是一個高速公路一樣的功能,在分割林立的手機App之間架起直通管道,減輕App間切換的痛苦,同時提升手機使用效率。
具體來看,「智能語義拖拽」就是把微信、簡訊等對話過程中產生的信息進行分析,按照所屬直接在地圖導航、美食評價和日程日曆等產品中使用。
但值得注意的是,鎚子最終展現的「智能語義拖拽」是一個一步到位的功能,用戶可以直接將一段文字拖入相關App中,而機器會在該過程中分析信息內容、提取核心相關信息、並且讓各個App各司其職——快速幫助用戶完成目的。
實際上這個過程中,鎚子還進一步整合了上次推出的「大爆炸」和「一步」兩大功能。
此次智能語義拖拽背後的技術提供方是三角獸科技,這是這家初創公司第二次出現在鎚子發布會上,上一次雙方合作的產品是「Big Bang」(大爆炸)。
據量子位了解,主打智能語義分析三角獸,在該功能從無到有誕生的過程中,總共向鎚子科技派出了3名工程師,共計耗時3個月,最大挑戰來自手機場景下的技術方案落地問題——在此之前並沒有廠商做出過嘗試。
三角獸技術負責人稱:智能語義拖拽涉及的是NLP中最核心最具挑戰的問題,通俗來講就是讓機器斷句,且學會中文語境下的「預感」,進而才能搭建機器學習模型。
不過,在和鎚子一起開發「智能語義拖拽」的過程中,最大的挑戰來自如何在手機場景下,最低限度降低機器模型對CPU、計算功耗等方面的消耗。
而且作為一個功能型產品,還需要考慮聯網和本地兩種交替情況下如何保證速度,因為反應速度會直接影響用戶體驗。
「更傾向於合作方是使用網路版的介面,但因為手機涉及用戶隱私,或網路情況不佳,就可能需要用到離線版本。
然而緊接著需要解決的問題是離線版本對系統資源的佔用,此外運算速度如果太長就會比較傷害用戶體驗。」三角獸工程師說,同時表示這是最大的考驗。
然而,這個最大考驗解決後,獲利方也將最大化。
在鎚子方面的合作實現後,三角獸工程師也坦言,可以無障礙適配到更多的手機產品中。
雖然之前並沒有其他手機廠商擁有這樣的需求,但在此次堅果Pro的合作中,三角獸和鎚子一起完成了從最低配版本的堅果手機,但最高配版本的旗艦機M1L的適配——遷移的成本已經很小了。
這也意味著,一旦其他手機廠商跟進遷移該功能,未來大量涉及不同應用間切換的內容,都將變得 so easy,比如微信中約定吃飯的時間地點,同時將內容拖拽入「日曆」、「地圖」和「大眾點評」等應用中即可。
4)閃念膠囊
「閃念膠囊」是個新鮮事,但偉大的是解決問題的出發點,而非實現的技術難度上。
坦白講,這只是一次「語音備忘錄」和「語音識別」的功能綜合,但正如羅永浩所言,這幾年來,並沒有人為此付出過實際性舉動,並且難能可貴的是,鎚子將通過開源,讓跟多非鎚子手機用戶也能使用。
這也是鎚子AI工具產品思路中的集大成之作。除了語音識別,「閃念膠囊」背後還應用了智能語音拖拽、大爆炸和一步。
在接受量子位的採訪中,科大訊飛方面的負責人表示,此次也在「閃念膠囊」中和鎚子進行了協作,主要涉及語音識別方面。
與「智能語義拖拽」面臨的問題相似,「閃念膠囊」最大的問題是如何在手機設備下實現對資源的合理調用。
如羅永浩發布會上所言,最後鎚子和訊飛給出的方案是:首選聯網識別,但如果網路情況不佳,則先使用訊飛語音識別本地方案,再在網路情況良好時聯網修正。
語音識別和自然語言理解
不難發現,鎚子新品發布會上重點推出的工具產品/功能,背後的主要技術是語音識別和自然語言理解及處理,這也是目前人工智慧最成熟、進展最快的兩大領域,也是中國人工智慧公司全球領先的領域。
語音識別方面,從科大訊飛、百度,到搜狗,都已經在大語料資料庫的基礎上,將語音識別的準確率提升到了97%以上,這在國際公認的標準參數都已然處於領先,並且訊飛還實現了方言領域的高識別率,可以說這是鎚子可以實現一系列語音交互為基礎的產品的底氣所在。
通常情況下,相比鍵盤為代表的文字輸入,語音要高效很多。這也是目前最被看好的新一代人機交互技術,包括亞馬遜、谷歌、微軟、百度和訊飛在內的公司,都在積極推動語音識別為核心的交互平台的運用,希望自己的語音交互平台,會成為下一個iOS、下一個安卓。
自然語言理解方面,百度的度秘、微軟的小冰,以及三角獸等為代表的創業新勢力,都已經取得了不俗的進展。無論是小冰的聊天,百度的「讀」新聞,三角獸的中文斷句,都在自然語言理解、自然語義處理方面,為鎚子的產品式整合掃清了障礙。
可以說,這是人工智慧進展給於鎚子的機會,但同時也是手機行業正在經歷的技術變革——與晶元、工業設計等硬體大戰不同,這一次革命將體現在「軟體」上。
智能手機正迎來新時代
今年3月,量子位曾有文章稱《沒有人工智慧的硬體,未來可能不配叫智能硬體》,當時三星新旗艦Galaxy S8發布會上,安卓陣營巨頭推出了人工智慧助手Bixby,這是一個類似蘋果Siri的產品。
同時也是羅永浩所稱的全局性解決問題的語音助手產品,即便他暫時不看好,也已經賽道密集潮水洶湧。
在國內,華為率先在國產手機中推出了語音助手產品「小E」,讓用戶用自然語言的方式,向它求助在手機使用過程中遇到的各種問題,但具體使用情況來看,用戶需求度還不高,場景尷尬的問題始終沒有得到解決。
此外,另一種利用AI全局性解決問題的產品是「系統優化」,通過個性引擎,在用戶使用習慣的基礎上形成用戶畫像,然後在使用過程中實現「預判」和「推薦」。
比如從EMUi5.0系統開始,華為便開始對外宣稱手機系統能夠學慣用戶的操作行為,通過這種方式,系統將可以實現對用戶操作的提前預判,依此進行資源的合理分配,從而為用戶帶來更加流暢的體驗。
同樣方向出發的還有魅族。這家總部位於珠海的手機廠商,在2016年年底伴隨手機系統Flyme6推出了「One Mind」,這是一個通過用戶畫像幫助手機用戶完成分析、決策的內置程序,最突出的亮點是幫助CPU提升運行效率、進而提升用戶體驗。
當然,沒有在系統方面明確宣稱人工智慧進展的小米,也在利用AI提升用戶體驗,比如在個性拍照和相冊歸類等方面的應用,背後是機器視覺方面的能力。而且值得注意的是,小米已經在電視等產品中實現了語音助手、興趣引擎等方面的落地,相信手機場景下的應用,也只是時間問題而已。
最後,讓我們再回到鎚子科技的堅果Pro發布會。雖然長達3小時的演講展示中,羅永浩隻字未提「人工智慧」,但通不難看出鎚子科技想要改變的現狀——智能手機產品創新遭遇瓶頸的現狀,需要新技術新交互提升易用性的現狀。
羅永浩說,鎚子只有現在做好準備,才能在下一代人機交互革命中成為上桌選手,才能由此實現「大到嚇人」的野心。
想這麼乾的不止羅永浩。
下一代人機交互革命正在加速到來,正在AI浪潮中日漸清晰。
【完】
招聘
量子位正在招募編輯記者、運營、產品等崗位,工作地點在北京中關村。相關細節,請在公眾號對話界面,回復:「招聘」。
One More Thing…
今天AI界還有哪些事值得關注?在量子位(QbitAI)公眾號對話界面回復「今天」,看我們全網搜羅的AI行業和研究動態。筆芯~
另外,歡迎加量子位小助手的微信:qbitbot,如果你研究或者從事AI領域,小助手會把你帶入量子位的交流群里。
推薦閱讀:
※鎚子科技的CEO羅永浩是一個什麼樣的人?
※形似神不似:效仿小米模式的鎚子工匠聯盟缺了什麼?
※鎚子手機的購買攻略有哪些?
※小米手機好用還是鎚子手機好用?
※堅果Pro 2會拯救鎚子科技么?