超過十分之一的報告篇幅給語音,互聯網女皇為何看好麥克風?
KPCB合伙人、享有「互聯網女皇」稱號的瑪麗·米克爾的互聯網趨勢報告於今天正式發布。毫不誇張地說,這份報告是互聯網行業分析的「超級碗」,它用200多頁的Keynote濃縮了全球龐大而複雜的互聯網發展現狀和趨勢,是互聯網從業者、投資人以及想要窺見互聯網風貌的外界人士不可多得的參考資料。
有人說,今年報告亮點不多,在我看來,亮點卻非常之多:不僅覆蓋了手機、電商、社交、廣告等基本面,還點名了移動營銷、網路直播、智能汽車諸多正在崛起的所有新興領域。與IDC等機構報告不同的是,女皇報告更側重於行業現象概括和行業趨勢展望,事實證明,她對未來趨勢的評判準確率相當之高。而今年報告最大亮點在於:語音。213頁的Keynote,23頁給了語音,篇幅遠遠超過汽車、直播等領域,僅次於每年的重頭戲即「營銷」的31篇。
女皇認為麥克風正在取代鍵盤
瑪麗·米克爾認為,語音正在被重塑,成為人機交互的新範式,在過去75年里,每10年就有一次人機交互的重大革新,人類對機器的操作,從物理手柄按鍵,到物理鍵盤滑鼠,再到觸摸屏,而現在語音成為了重要的交互方式。
在其看來,語音交互相對於傳統交互而言具有以下特點:輸入更快速,人類每分鐘可說出150個單詞,打字卻只能完成40個單詞;使用更簡單,不需要用手和眼,時間更及時,不需要任何學習;更加個性化,機器可基於上下文、環境、位置、語調等大環境更好地理解人類的需求。從技術角度來看,語音計算具有成本低、尺寸小的特點,特別適合物聯網。
為何語音現在會爆發?瑪麗·米克爾認為:
1、技術成熟是核心原因之一。如果語音識別準確率從95%提升到99%將從量變引發質變,即「爆發點」到來,語音識別準確率已從2010年的70%上升到今年的90%,百度、谷歌、Hound等平台的語音識別準確率已超過90%,針對戶外嘈雜環境和講話者特性的語音識別是下階段的攻克重點。
2、語音交互應用正在日益變多。語音搜索正在蠶食搜索份額,百度、谷歌的語音搜索在近十年來均取得了數十倍的增長,其中安卓、百度和必應語音搜索比例分別達到20%、10%、25%;以Siri為代表的語音助手正在快速普及,美國用戶使用這類工具的比例,已從2013年的30%增加到2015年的65%。因為語音能夠解放雙手和眼睛,人們越來越多地在車裡、家裡和隨身使用語音。相關數據顯示,從2014年到2016年間,全球API調用百度語音識別以及文本轉語音(TTS)的每日使用量急速攀升,百度語音在百度產品中使用率快速增長。
3、語音吸引更多第三方開發者。開發者擁抱語音大幅增加了支持語音交互的軟體和硬體,女皇重點闡述了Amazon眼下炙手可熱的硬體:Echo。其內置了AmazonAlexa語音助手,目標是佔領家居、汽車、手機的麥克風,還能智能購物。這款產品銷量已突破400萬台。女皇更是大膽指出:語音拐點已經到來,在2015年智能手機銷量下滑之後,Echo銷量或將騰飛。
英雄所見略同。在瑪麗·米克爾預測語音會成為核心交互方式的同時,科技巨頭早已在這一領域大力投入。2014年百度世界大會上李彥宏預測:五年內語音和圖像搜索比例有可能突破50%。百度在人工智慧上一項顯著的進展便是基於深度學習的DeepSpeech在噪音環境下的語音識別效果超越了谷歌,這一研究成果在瑪麗·米克爾的報告中被提及,該項技術已成功應用到百度語音搜索上。目前,百度語音搜索已通過人工智慧做到了「聽」和「說」,而且還嘗試完成人類複雜的行為——溝通。集成語音識別、語義理解、深度問答、知識推理、多輪對話、智能摘要、情感分析、語言生成、語音合成等能力於一身後,相較於鍵盤輸入,百度語音搜索已經能夠滿足用戶的多種複雜需求,引領人機交互邁入聽說時代。
此外,不久之前的谷歌I/O大會上,最亮點產品是類似於Echo的Google Home,其內置了GoogleAssitant語音助手。而在即將召開的蘋果開發者大會WWDC上,iOS 10最大亮點很可能會是Siri。語音是下一站,已成全球共識,「麥克風+觸摸屏」取代「鍵盤+滑鼠」,已是大勢所趨。
語音正在多個領域全面開花
「女皇報告」重點提到了語音的三大典型應用:搜索、助理和Echo,一個重要事實是,語音不只是在這些領域發揮作用,在許多領域,它都比鍵盤越來越有存在感。
1、語音搜索:移動搜索的重要分支
谷歌、百度、Bing,全球主流搜索引擎的語音搜索比例都在逐步增加,麥克風圖標變得跟搜索框一樣重要。搜索引擎來自移動端的搜索流量均已超過50%,人們在自帶麥克風的移動設備上使用語音更方便,而在移動場景下打字並不方便。有報告指出,百度語音搜索的整體用戶量在2015年增長超過3倍,用戶中的90後和00後的人群佔比接近50%,百度語音搜索已經成為眾多年輕人移動互聯網生活的標配,優勢在於省去了中英文輸入法切換的繁瑣、支持口語化多輪交互、能夠提供貼心的語音播報和有聲搜索。
2、語音助手:不再是被調戲的玩具
幾年前,Siri這是一個被調戲的玩具。現在,它可以理解很多命令,比如設置鬧鐘、添加日曆,打開App等,語音助理已完成從玩具到工具的蛻變。除了Siri之外,Windows內置的Cortana、GoogleNow升級而來的Google Assitant,以及百度、搜狗、科大訊飛等公司均推出了自己的語音助理軟體。以百度推出的度秘為例,已經接入到手機百度APP,用戶可在手百端直接調用,使用語音對話的形式享受點餐、購物、路線、訂票等多項生活類服務。可見要做好語音助理並不容易,除了語音識別和語義理解之外,它必須要能「完成任務」,而這需要獲取其他設備和應用的控制權,而這一點只有巨頭才能做到,創業型玩家基本已經消失。
3、語音通訊:不再是昂貴的溝通
微信能夠成為超級App,一大重要原因在於它支持語音通信,類似於對講機的語音交互,給了人們在傳統手機通訊下前所未有的體驗。需要流量,但相對於傳統電話而言已很廉價。事實上,傳統電話也已被互聯網化,有信等網路電話App的崛起表明,人們未來只需要為語音通訊花很少的錢。女皇說,語音是最有效率的交互方式。除此之外,語音還是最自然、最簡單和最有效的溝通方式,免費的語音通訊將會成為大勢所趨,運營商正在被逼著依靠販賣流量謀生。
4、語音內容:不再是冷門的形式
微博剛剛興起時,許朝軍做了一個啪啪,要做語音版的微博,後來發生的事情大家都知道了。不過,語音內容正在捲土重來。最近在行做的「分答」十分火爆,這款App集合了語音、打賞、共享經濟諸多新興模式,讓知識分享前所未有的有趣。而在去年,喜馬拉雅等網路電台崛起了。這些現象均表明,「聲音」依然會是十分重要的一類內容形態,人們不會浪費耳朵這個重要器官,在許多場景下,「語音消費」都更適合,比如開車時,高德地圖與林志玲等明星合作的語音導航就取得很好的市場反饋。在許多垂直領域,例如教育,語音技術同樣在體現其重要性,比如通過語音技術做口語訓練。就是說,不只是「麥克風」變得重要了,「喇叭」也在變得重要。
5、語音硬體:隨時待命的助理
「女皇報告」說,Amazon Echo將要起飛。除了Echo之外,Google 已推出GoogleHome硬體,擁有Siri的Apple很可能會發布類似產品。為何「語音助理硬體」會普及?為什麼不直接用手機上的Siri等助理呢?因為手機是個人設備,並不適合家庭成員共享;而當前的語音技術,讓手機支持「隨時待命可被喚醒」會很耗電,基於Echo等家用設備不需擔憂這個問題。正是因為此,類似於Echo的產品將成為接下來的爆點,國內巨頭同樣在布局,京東已推出叮咚智能音箱,阿里巴巴聯合科大訊飛推出了「飛兒」,語音技術成熟的百度近日推出的度秘實體機器人也成功入駐肯德基,通過多輪交互和語音語義理解等技術為用戶完成智能點餐的過程。除了專用的語音助理硬體,語音與電視、與汽車等硬體的整合也會加速,國內的「Echo」大戰即將爆發。
正如女皇報告所指出的那樣,語音即將成為最重要的交互方式之一,語音技術從量變到質變的引爆點已經到來。除了交互之外,語音還將在搜索、內容、通訊和硬體等領域全面開花,「麥克風」變得重要,「喇叭」亦將變得重要,關於聲音的戰爭已經拉開序幕。
微博@互聯網阿超 微信 羅超(luochaotmt)
推薦閱讀:
※垃圾郵件和 Bot 的前世今生
※想不到 原來你是這樣的SIRI
※知乎 SiriKit 實戰
※上海話siri的效果如何?
※Siri 如果支持在 Mac 桌面端使用,可以做哪些事情?