揭秘武林絕學——「聽聲辨位」 | AI公開課
自從華山論AI:氣宗還是劍宗更強? - 知乎專欄掀起武林紛爭以來,愛恨情仇的故事從未停息。傳奇仍在繼續,新的風暴已經出現——聽說目前江湖上最流行的武功神技叫聽聲辨位,今天我們的AI公開課就來聊一聊這獨門絕技的背後需要怎樣精奇的骨骼?
為了幫助各位大俠早日習得絕技,本期的AI公開課,我們邀請了科大訊飛資深研發工程師遠哥為我們詳細揭秘。
主講老師:遠哥
畢業於哈爾濱工業大學,參與和主導過多個語音雲項目的研發建設,對語音技術和終端開發有深刻的理解。精通Java、C/C++等多門編程語言。近年來專註智能終端人機交互領域,支持Ninebot、美的空調、優必選、狗尾草等近千家機器人和智能家電廠商。目前帶領團隊攻關麥克風陣列語音晶元產品的研發工作。
「聽聲辨位」,顧名思義,就是靠聽到的聲音辨別聲音發出的位置。最簡單的例子就是,有人在背後喊你,你總不會一個勁兒朝前找吧~
科學的來說,這是因為人的兩個耳朵以及神經系統對於單耳接受到的聲音進行特徵(包括時間差和強度差)分析和識別,從而得出了位置判斷。
「聽聲辨位」在江湖裡可就厲害了,作為一項絕技,它可是大俠們行俠仗義、縱橫武林的「殺手鐧」!
《射鵰英雄傳》里的柯鎮惡——「聽聲辨位、發射毒菱」的好手
不過,想要真正在江湖中習得一手上乘的「聽聲辨位」武功可是困難重重的——聽聞訊飛派的聽聲辨位造詣已爐火純青,而究其訣竅,恰恰在於使用了能夠對聲源進行定位的麥克風陣列。
麥克風陣列可以自動檢測聲源位置,跟蹤說話人,聲源定位信息既可以用於智能交互,也可以用於後續的空域濾波,對目標方向進行語音增強。因此,不論你在哪個位置出招,只要發出了聲音,麥克風陣列就能幫助各位俠士輕鬆定位,捕捉你的一招一式,行走江湖而立於不敗。
什麼是麥克風陣列?
麥克風陣列由一定數目的聲學感測器(一般是麥克風)組成,用來對聲場的空間特性進行採樣並處理的系統。其中包括以下兩個方面:
遠場拾音,指運用遠場識別和降噪技術,使拾音距離達到5米。
聲源定位,利用麥克風陣列,實現360°語音信號採集,並能通過聲源定位來確定目標說話人的方向。
能夠定位聲源的麥克風陣列
麥克風陣列的功能
厲害的可不止這點,光聽的見可不夠,真正的大俠,還需要能夠聽的清!
能夠「聽聲辨位」的麥克風陣列還具備以下的功能:回聲控制,回聲消除,回聲抑制;去混響;波束形成,聲源定位,語音增強,盲源分離,干擾抑制;雜訊控制,主動雜訊控制,降噪。
麥克風陣列的功能
電影《十面埋伏》中章子怡飾演的小妹通過聽聲辨位完成了精彩的舞蹈
去混響
在這其中,最主要的就是「去混響」了,因為聲波要經過多次反射和吸收,最後才消失。大俠需要集中精神,做出最快最正確的反應!
當聲源和麥克風之間的距離越遠,反射聲占的比例就越高,混響就嚴重。經典的去混響方法包括形成拾音波束來減少反射聲和基於反卷積的去混響方法。
去混響的不同方式
訊飛開放平台麥克風陣列產品
當然,功力不同能夠應對的場面也不同,真正的大俠可以在極其複雜的環境中,仍然面不改色。為應對不同的環境,訊飛開放平台麥克風陣列產品主要分為二麥、四麥、六麥克風陣列。
六麥環形陣列適用於應用場景較為複雜(例如商場、辦公室),對角度定位要求比較高,回聲消除和識別率要求較高的機器人和家居產品解決方案。
四麥線性陣列適用於車載,空調,電視,應用型機器人等智能裝備,支持0~180°角度定位,回聲消除和連續喚醒等功能。
兩麥線性陣列對晶元性能要求較低,適用於低成本的智能裝備解決方案,支持回聲消除和雜訊抑制等功能。
麥克風陣列構型
江湖多險惡,絕學傍身很重要。「聽聲辨位」的神技說難不難,想要煉成,聽得遠、聽得准、聽得清缺一不可。有了麥克風陣列這一至尊神器,相信各位大俠行走江湖必然多了幾份底氣,少了幾分擔憂!
其他課程
如何通過觀察女友朋友圈維持異地戀? - 知乎專欄
華山論AI:氣宗還是劍宗更強? - 知乎專欄
這年頭,連和尚也開始賣萌了?! - 知乎專欄
推薦閱讀:
※劉慶峰:2018年是科大訊飛國際化的元年
※科大訊飛:請不要曲解我們的財報!
※一早,姑媽給我發來個視頻......
※胖·師說|戊戌新年,三類小工具助力智慧學習
※訊飛聽見出APP版了?!快把錄音整理神器裝進口袋裡!