人工智慧技術終結「耳聾工廠」:85分貝雜訊下仍可識別語音

人工智慧技術終結「耳聾工廠」:85分貝雜訊下仍可識別語音

原標題:人工智慧技術終結「耳聾工廠」:85分貝雜訊下仍可識別語音

對於大多數人來說,語音識別技術的應用場景大多在智能手機的語音輸入法、語音助手等日常行為中。實際上,語音識別技術在許多噪音工廠正發揮更多的作用。

近日,阿里巴巴機器智能技術實驗室稱,團隊正將語音識別的應用領域拓寬到了工廠,以解決「耳聾工廠」問題。

說話基本靠吼的生產車間

在許多中小型工廠車間里,工人之間的交流通常靠喊、吼。雜訊,也成為了工廠工人擺脫不掉的困擾,「職業性雜訊聾」已成「塵肺病」後,全國第二大職業病。

在97分貝環境中作業的編織廠工人

根據《職業性雜訊聾診斷標準》等相關標準,雜訊大於等於85分貝便可認定為雜訊作業環境,工人需有所防護。

據北京中醫藥大學東直門醫院耳鼻喉科主任醫師劉建華介紹,目前,職業性雜訊聾呈增發趨勢。另外,高雜訊對人聽力損害是逐步顯現,潛在危害比較高。很多工人習慣了在超85分貝的高噪音環境工作後,覺得沒事。但暴露在該雜訊環境中超過3個月,對聽力將造成不可逆的損害。這樣的損害持續積累,當工人發現聽力出現問題時,已很難恢復。

然而,大多數中小製造企業沒經驗和能力考慮降噪。最現實的,還是給工人戴防護耳罩,但又不便於交流。在金華一家小型印刷廠,車間雜訊接近90分貝。一位工人說,他每天工作10個小時左右,工廠接單多,他和同事須時刻交流、協同調適印刷機。但「帶上防護耳罩就聽不見同事說話。」

手機+語音終端,讓防噪器具真正奏效

為了解決上述問題,阿里巴巴機器智能技術實驗研發了高工業雜訊環境下的語音識別及傳輸技術。這項技術已經實現在85分貝工業雜訊下,將一米處正常音量語音轉換為文字,並可發送至手機等設備上。

在高雜訊環境下,阿里巴巴工程師正在測試語音識別設備

「實現高雜訊下的語音識別,主要依靠是陣列麥克風技術以及AI語音識別模型。陣列麥克風配合演算法,可有效提取出純凈語音信號。AI語音模型則能識別語音信號含義並轉換成正確文字。

據阿里巴巴介紹,語音轉換的過程都在雲端完成,只要有網路並配上類似智能音箱的語音終端,便可構建局域性的語音文字轉換和傳輸系統。

「轉換為文字的信息,可指定傳輸至手機等帶顯示屏設備。只要一部手機,一個語音終端,便可組建高雜訊語音交互系統。」 雲鎧說。

目前,阿里巴巴的語音識別技術能在85分貝的噪音環境下,對一米外正常音量語音做到準確識別,按照預期,他們希望能實現在95分貝噪音下的語音識別。


推薦閱讀:

語音喚醒詞的HMM結構設計
使用新技術讓播客市場指數增長
人工智慧入門:AI產品經理需要了解的五大語音交互評價指標
語音交互文章集錦(長期更新)
智能語音電銷神器!

TAG:機器學習 | 語音識別 | 深度學習DeepLearning |