有能把錄音變成文字的軟體么?


推薦兩個chrome的應用。這兩個應用都是把實時的語音轉為文本,都支持中文在內的10多種語言,準確率非常高無需註冊而且免費

1、Speechnotes 。https://chrome.google.com/webstore/detail/speechnotes-speech-to-tex/opekipbefdbacebgkjjdgoiofdbhocok?utm_source=chrome-ntp-icon

Speechnotes

語音筆記

專業語音識別文本編輯器

用於聽寫和打字的不需分心、快速、易用且免費的網路應用

Speechnotes是一個功能強大的開啟了語音功能的在線記事本,旨在通過採用簡潔和高效的設計來助您思考,從而使您可以專註於您的想法。

我們努力提供最好的在線聽寫工具,我們所用的方法是結合尖端語音識別技術來取得當今科技所能得出的最準確的結果,再加上結合內置工具(自動或手動)來提高用戶的工作效率、生產率和舒適度。

完全在您的Chrome瀏覽器中在線工作。無需下載,無需安裝,甚至無需註冊,這樣您就可以立即開始工作。

2、Voice Recognition。https://chrome.google.com/webstore/detail/voice-recognition/ikjmfindklfaonkodbnidahohdfbdhkn?utm_source=chrome-ntp-icon

Type with your voice. Dictation turns your Google Chrome into a speech recognition app.

You can use Google Chrome as a voice recognition app and type long documents, emails and school essays without touching the keyboard.


VoiceBase | Store, Search and Share Recordings

如何簡單的生成機器字幕,降低聽譯壓力(如機器字幕有錯誤請自行修改)

視頻封面如何簡單的生成機器字幕,降低聽譯壓力(如機器字幕有錯誤請自行修改)視頻


先準備一段會議錄音,標準普通話錄製,再用幾款軟體識別對比: 涉及訊飛語音,百度語音,雲知聲,IBM WATSON
結果:Watson完勝。百度不支持大音頻文件,未能完成比賽。

音頻信息

音頻格式:PCM,2.41MiB

混合碼率模式:CBR

平均混合碼率:256Kbps

16.0KHz,16位,1聲道PCM

標準答案節選自十六大報告,故意降低了識別難度:
十五大確立鄧小平理論為黨的指導思想,提出黨在社會主義初級階段的基本綱領,明確了我國跨世紀發展的奮鬥目標和任務。為貫徹十五大精神,中央先後召開七次全會,分別就農業和農村工作、國有企業改革和發展、制定「十五」計劃、加強和改進黨的作風建設等重大問題,作出決定和部署。五年來,我們走過了很不平凡的歷程,在改革發展穩定、內政外交國防、治黨治國治軍各方面都取得了巨大成就。
國民經濟持續快速健康發展。實施擴大內需的方針,適時採取積極的財政政策和穩健的貨幣政策,克服亞洲金融危機和世界經濟波動對我國的不利影響,保持了經濟較快增長。經濟結構戰略性調整取得成效,農業的基礎地位繼續加強,傳統產業得到提升,高新技術產業和現代服務業加速發展。

雲知聲識別結果:
誰有五大確立鄧小平理論為黨的指導思想,提出。反社會主義初級階段的基本綱領明確了我國。跨世紀發展的奮鬥目標和任務,為貫徹實用。那精神,中央先後召開七次全會分別就。和農村工作國有企業改革和發展,制定。計劃加強和改進黨的作風建設等重大或。的,做出決定和部署,五年來我們走過了。很不平凡的歷程,在改革發展穩定內政外交。國防治黨治國治軍各方面都取得了巨大成就。國民經濟持續快速健康發展實施擴大。內需的方針,是誰,採取積極的財政政策和穩。現在貨幣政策和福亞洲金融危機和世界經濟。波動對我國的不利影響,保持了經濟較快增長。經濟結構戰略性調整取得成效,農業的進。土地會繼續加強傳統產業得到提升,高。從技術產業和現代服務業加速發展。

訊飛語音識別結果:
十五大確立鄧小平理論為黨的指導思想,提出。在社會主義初級階段的基本綱領,明確了我國。跨世紀發展的奮鬥目標和任務,為貫徹省。那精神,中央先後召開七次全會,分別教育。業和農村工作,國有企業改革和發展,制定。中午計劃,加強和改進黨的,作風建設等重大活動。皮,作出決定和部署,五年來,我們走過了。很不平凡的歷程,在改革發展穩定內政外交。國防治黨治國,治軍各方面,都取得了巨大成績。國民經濟持續快速健康發展,隨時擴大。內需的方針,適時採取積極的財政政策和我。現在貨幣政策,克服亞洲金融危機和世界經濟。你波動對我國的不利影響,保持了經濟較快增長。經濟結構戰略性調整取得成效,農業的。土地會繼續加強,傳統產業得到提升,高。新技術產業和現代服務業加速發展。

Speech to Text Demo識別結果(需要爬牆出去)
十五大確立鄧小平理論為黨的指導思想提出黨在社會主義初級階段的基本綱領明確了我國跨世紀發展的奮鬥目標和任務。為貫徹十五大精神中央先後召開七次全會分別就農業和農村工作國有企業改革和發展制定十五計劃加強和改進黨的作風建設等重大問題作出決定和部署。五年來我們走過了很不平凡的歷程在改革發展穩定內政外交國防治黨治國治軍各方面都取得了巨大成就國民經濟持續快速健康發展。實施擴大內需的方針適時採取積極的財政政策和穩健的貨幣政策克服亞洲金融危機和世界經濟波動對我國的不利影響。保持了經濟較快增長。經濟結構戰略性調整取得成效農業的基礎地位繼續加強。傳統產業得到提升高新技術產業和現代服務業加速發展。

百度語音:
「暫不支持大文件語音識別」

測試日期:20170120

(個人與以上各家無任何關係,之前一直在用訊飛,除了輸入詞庫差點,語音識別準確率還是很不錯的)


好吧,這個是我找到的感覺比較靠譜一點的方法……
老娘目前還深深為此事愁苦!
尼瑪不當記者了還要處理錄音沒有天理~~

(轉載)你可以嘗試試用一下這個軟體:
IBMViaVoice語音輸入系統,這個系統可用於聲控打字。對著微機講話,不用敲鍵盤即可打漢字,理論上每分鐘可輸入150個漢字,是鍵盤輸入的兩倍,是普通手寫輸入的六倍。該系統識別率可達95%以上。如果配備了高性能的麥克風,使用便利,適合於起草文稿、撰寫文章。
使用效果也還可以。就是最開始的時候,做適應自己語音訓練的時候特別麻煩一點。

或者第二個方法:
在 Office XP 中使用語音識別的示例

Microsoft Office XP 的簡體中文、英語(美國)和日語版本提供了此功能。

您可以使用語音識別功能來口述命令,將文本寫入任何 Office 程序。也可以使用語音來選擇菜單、工具欄、對話框(僅限於美國英語)和任務窗格(僅限於美國英語)項目。

要使用安裝的語音識別功能,請單擊「語言」欄上的按鈕,以便在語音識別的兩種模式(「聽寫」模式和「聲音命令」模式)間切換。

單擊下面的示例以獲得關於如何使用語音識別的信息。

使用「聲音命令」模式

使用「聽寫」模式

使用「語言」欄上的聲音消息

網上也有很多自稱可以實現語音轉換文字的軟體,
老娘下載嘗試了很多,有的直接是流氓軟體,
有的看起來像是語音識別軟體但不具備真是功能,
傷心啊,哪位大神推薦一個靠譜實用的軟體。


這裡講把音頻文件轉為文字的服務,不是實時識別的那種。

中文的話目前只找到付費的訊飛聽見比較靠譜,準確率挺高,轉寫也挺快,免費送兩小時。另外手機上的錄音寶App也是科大訊飛的,與訊飛聽見類似。

以下是英文

推薦用YouTube自動識別服務,準確率還可以,不過得等一會兒(根據音頻時長大概15分鐘至幾小時吧,偶爾也會有幾天才轉好的情況)。具體方法可以看這篇文章。

另外IBM Watson的Speech to Text感覺識別準確率比較差,不過支持API,可以嵌入到代碼中(也支持中文)。

另外Voicebase註冊送接近20小時的轉寫服務,還沒體驗過不知服務咋樣。使用方法可看這篇文章。

訊飛聽見最近推出了轉寫英文的服務,每天有300個名額可以免費轉兩段一小時的音頻,試用了下效果還不錯。

百度最近推出了SwiftScribe可以轉寫英文,不過還是beta版本要申請了才能用。


我加一個冷門的吧 IBM 的watson Speech to Text 能夠上傳不大於100MB的文件,也能馬上說,準確率尚可。免費的API,可嵌入程序中。


http://aioffice.hcicloud.com 可以把錄音轉成文字,支持中文、維語。

轉寫10分鐘左右的音頻大約要2分鐘,也能夠在線編輯。

這網站也能做圖片上的文字識別


目前來說只能有兩種選擇:

一是自己把錄音轉成文字,藉助一些快捷鍵和小工具,可以實現邊聽邊打,省些時間和精力追音小匠。但如果純靠拼音、五筆之類的手段非常耗費時間。

二是使用專業的錄音轉文字服務,價格約在70-80元/小時左右,淘寶百度上有很多,可以自行搜索。

不過,現在Google已經在測試一些連續語音識別的API:

Chrome Browser

只是成熟度顯然還無法滿足需要。


如果你是做記錄、聽課、學習等方面需要用到語音轉換,推薦使用網易的有道雲筆記,裡面有一個語音速記功能,使用的也是訊飛的技術,識別率很高的,聽課的時候把軟體打開放一邊,聽完課後自動轉換成文字了,實時轉換非常方便。

如果你是需要把已經有的錄音轉換過來,可以先打開語音速記,然後切換到播放器去播放錄音,這樣也可以實現語音與文字的轉換。


第一,這麼多回答都在說某軟體真有意思啊。

第二,希望不會有人說我是在做推廣。

第三,其實我想說的是 YouTube,現在支持好幾種語言的自動識別字幕,不包括中文,當然有錯誤,但免費方便,字幕還可以在線修改或下載。把視頻上傳然後選好語言等上一會兒就行了。如果是語音文件,網上還有語音轉視頻然後上傳的工具。


錄音是中文還是其他語言,需要的準確率是多少,語音識別解碼器開源的也比較多,至於軟體方面我不是很清楚,可以試著找找 dragon(nuance),vivivoice(訊飛),viavoice(ibm),

或是自己寫段代碼調用微軟的SAPI,或是google的識別器(andriod)!


推薦科大訊飛出的語記,能夠將錄音快速轉寫為文字,我都是寫文章用口述了~


這是做軟體的在自嗨么??

訊飛我都不說了,去年的時候就有人和我推薦,給了一下免費的轉寫時限,我試了一下,不說一般 垃圾,字是沒一個錯的,就是意思不對,要不就是亂碼漢字,這樣的文稿,我們速錄師做出了是要不到錢的。

圖片是今年兩會訊飛聽見做的效果,都成速錄圈的笑話了。

一般來說政府的會議是我們行業最好做的,語速勻,會場條件好,就這條件,你給整成啥了,我說訊飛,兩會也是全球很多億人在看呢,好好練練基本功在出來混飯。

還有一個在上邊答覆(廣告)里看見的

我就想問一下,一般會議一般會議,少點按30分鐘算,你在怎麼做到錄音清晰,還不超過20M的,無語。


miui8 錄音機


語音輸入法已經很多了,甚至電腦操作系統都自帶語音識別功能了。經過自己實測和資料查找,(比如以下這個資料:

哪個更好用?搜狗/訊飛/百度三款手機輸入法全面對比評測 )

選了訊飛。訊飛輸入法的語音輸入功能是目前漢語語音識別最好的輸入法,使用此輸入法(Windows, Android, IOS 版本都有),你可以在電腦手機里平板里任何可以寫字的地方用語音輸入文字。

對於手頭已經存在的音頻文件,比如說會議的錄音、口頭作文、演講錄音,可以上傳到訊飛聽見的官方網站,進行雲端機器自動識別,甚至進行人工有償輔助識別。

聲明:與訊飛有利益相關,因為我是它的新用戶,我需要它給我好好乾活。


科大訊飛去年新出的手機錄音轉文字軟體錄音寶可以一試,有自動轉寫和精準轉寫兩種,前者免費,精準轉寫貌似有人工校對需要收費,好處在於快


科大訊飛有好多,除了最古老的訊飛輸入法的語音輸入外,手機端還有錄音寶,pc端有訊飛聽見轉寫網站,看你需要了


訊飛跟百度,語音轉寫。。。都是搞個什麼sdk介面,讓人怎麼搞。。有沒有直接上傳音頻文件就可以收到文字稿的這種網站、、、


訊飛語記(安卓)


嘗試過一些,以下是試用報告:

1.追音小匠並不是錄音轉文字,而是在一個界面利用快捷鍵,節省切換界面、暫停語音的時間,來提高人工轉寫的效率。只識別mp3,mav。

2.訊飛網站。手機號註冊後有120min的免費機器轉寫,僅限中文,準確率不高。

3. IBM的SPEECH TO TEXT, 需要翻牆,且識別的音頻格式為:wav,flac,opus。而且你要先把音頻截成若干小段並轉換以上音頻格式,準確率一般。提前是英文錄音必須非常清晰,口音純正。

4.VOICEBASE。郵箱註冊後有120min免費機器轉寫,上傳的文件可以選擇public和private,支持多種語言,轉寫速度非常快但是每幾個單詞被斷開連不成一句話,準確率也很一般。

以上機器轉寫都大大不如人工轉寫,如果不想花很多錢,只能自己一遍一遍聽寫了,哎。


推薦閱讀:

求自己在家樂器實錄的設備配置需要怎樣?
我預算是4000,想要買一套入門的錄音棚設備。大家看下下面的清單可以嗎?
個人錄歌究竟需要什麼設備才能達到接近錄音棚的效果?
如何將電吉他的聲音用線路直接輸入PC並進行處理?
在同期錄音中,哪些聲音是必須/盡量要錄好的?

TAG:錄音 | 語音識別 | 中文語音識別 | 文字編輯 |