科大訊飛的「人機耦合說」真的說清楚了嗎?背後究竟隱藏了什麼?
來自專欄 DeepTech深科技5 人贊了文章
2018 年 9 月 20 日,科大訊飛被指責在 2018 創新與新興產業發展國際會議上所使用的「智能翻譯」系統造假,其顯示的中文翻譯,並不是根據其感測器採集的聲音文件所呼應的,而是後台兩位同傳譯員臨場實時翻譯後,再由機器讀出來的。
而科大訊飛則在 9 月 21 日回應稱,該企業主要為主辦方提供兩種翻譯方案:一、直接由機器離線翻譯,現場全自動翻譯並同步展示在屏幕上,沒有任何人工同傳參與;二、直接轉寫同傳語音,並且為同傳語音打上字幕,直播提供中英文對照的字幕。
科大訊飛認為,第二項業務是人機耦合,可以降低同傳工作者工作強度、賦能翻譯人員,並在聲明中特彆強調:人機耦合才是未來。
這個答案顯顯然沒有讓人們滿意,因為在該場會議的進行過程中,根據同傳譯員的說法,他們並沒有感覺到任何實質工作量上的減少。
同傳譯員的爆料,不只來自於對於此次會議工作流程的問題,更反映了部份新興科技變革所造成的抵觸情緒,就如同仍經常被提及的:「 AI 是否會取代人類工作崗位」,許多人將此視為危機甚或是威脅。
如果科技變革所帶動的效益,確實讓人無話可說,那麼時代就會繼續前進,該被碾壓的是那些沒能跟上腳步的人事物。但不可否認的是,包括新興科技的導入演化,都不會是一步到位的,失誤甚至是失敗都是常見的狀況,奚落嘲諷自是難免,但並不影響整體科技的發展。只不過當科技變革與商業利益產生交互作用,也就是靠著新興科技得以獲得不同型式的商業利益時,那勢必要面對更高的檢驗標準。科大訊飛此次所遭遇的狀況如此,許多靠著 AI 或者是其他新興科技拉高品牌知名度、獲得更高估值、融得更多資金的科技公司也都是如此。
人機耦合到底是個什麼?
根據科大訊飛在事件後的回應來看,科大訊飛在回答中提到了「人機耦合」這個名詞,誠然「人機耦合」是真實存在的一種理論,也被應用在了多種領域之中。但是,科大訊飛將「機器識別同傳譯員寫的譯文,再朗讀」過程認為是人機耦合,這其中確實存有歧義。
「耦合關係」本身是指兩個事物之間如果存在一種相互作用、相互影響的關係,同時耦合也是電路中的術語,指兩個或兩個以上的電路元件或電網路等的輸入與輸出之間存在緊密配合與相互影響,並通過相互作用從一側向另一側傳輸能量的現象。
那人機耦合指的是什麼呢?在學術界,人機耦合指的是一種「控制方法」。這項技術的英文名為「Human-Machine Coupling」,在機械相關應用領域,這指的人與機械的耦合,人機耦合因為其阻尼和剛度特性所帶來的高魯棒性,常被用來作為人體外骨骼對應的控制系統。
早在 2004 年,浙江大學的李曉明博士就在其由國家自然科學基金支持的論文《基於外骨骼技術的機器人遠程控制》中,把人機耦合視作了上文提到的控制方法。
換句話說,人機耦合也可以是一個仿生學、機械學的術語,在過去的使用上來看,並不完全等於人和電腦的耦合,但科大訊飛使用了「耦合」這樣的說法,的確也讓人疑惑,這會不會是科大訊飛自造了一個「人機耦合」的概念,以此來解釋他們用電腦朗讀出同傳譯員的過程呢?
這樣的質疑確有其道理,即使爭執名詞的使用,對於探究此事的真正影響不見得真有太大幫助,但讓人擔心的是,身為一家在科研、科技領域都有極大投入的公司,面對外界一般人對於科技技術的困惑,的確必須要更加審慎,用一個並不常見通用的學術名詞來解釋問題,恐怕也達不到原本希望的溝通釋疑的目的。
繼續說回人類同傳譯員。既然科大訊飛,那麼為什麼不直接使用同傳譯員便成了一個大問題。科大訊飛董事長劉慶峰迴應到:「考慮到會議的專業性,這次會議主辦方明確要求機器做轉寫工作。因而本次會議的產品 logo 全部採用『訊飛聽見』,沒有採用『訊飛聽見翻譯系統』。」
然而,微博上一位 ID 叫做 @ 同聲翻譯靳萌 的用戶發微博稱,「之前有翻譯公司找過我翻訊飛的會,說甲方給的條件是不能說出是真人在翻譯,否則就不要接。」
圖丨 @ 同聲翻譯靳萌 的微博截圖
對於會議在進行過程中,科大訊飛系提供了何種技術完成工作,外界其實並無法進一步確定,但不可否認的是,科大訊飛若是在會議當時未說明是使用了科大訊飛版「人機耦合」完成工作,從而讓人產生一種「翻譯和轉寫都是由訊飛聽見獨自完成」的認知,這的確就會有很大的問題。
事實上,許多看似酷炫、引發驚嘆的創新科技應用,當有其場景設置的條件與假設前提,在行銷活動或者是品牌宣傳時,這些設置條件與假設前提的說明,有時會因為某些因素被忽略不的。但這樣的作法,過去就經常出現在不同類型的行業里。
舉一個例子說明,當年英特爾(Intel)推出內建 Wi-Fi 的 Centrino 平台時,就曾作一了個廣告,廣告里的主角在荒野中的營地露營,但他拿著一台 Centrino 筆記本在上網查資料。英特爾這個廣告是要告訴消費者,以後不再需要受限於有線網路的限制,有了無線網路 Wi-Fi 之後,隨時隨地當可以連上網路。
但當年這個廣告在美國曾經被消費者告上法院,控告英特爾廣告不實,因為他看了廣告買了一台 Centrino 筆記本去露營,但卻上不了網。
現在回頭來看這個事件,許多人或許會覺得這夠傻了,沒有 Wi-Fi 基站網路,怎麼上得了網?但不可否認的是,在當時那個 Wi-Fi 還是新興科技的年代,這樣的基本常識是業者本身必須教育市場的,而不能期望消費者一上來就能理解的。
而同樣的,儘管這幾年 AI 應用看來滿地都是,但對於 AI 技術的運作,不只是在技術面上仍是一個正在持續探索的黑盒子,對於身處應用終端的消費者而言,他們唯一能夠理解的信息來源,就只有提供服務的業者,如果業者本身自己都說不清楚,或者是不說清楚,那又怎麼能指望一般大眾真的理解呢?
這事還沒完
雖然科大訊飛版人機耦合的事情說完了,不過科大訊飛沒有在會前向外界公布「訊飛聽見沒有翻譯工作,而是直接朗讀同傳譯員的譯文」這件事始終是錯的。於是就有了另一種猜想,訊飛是為了面子才不說,還是為了別的?
訊飛聽見是科大訊飛在 2015 年年末發布的,該發布會名為《A.I. 復始,萬物更新》,並且該企業一口氣連發了 AIUI、錄音筆、錄音寶、智學網、E 聽說等多樣產品,以及訊飛超腦 2.0。這對於訊飛來說是一件很勁爆的事情,畢竟光是同時運營這麼多產品,就很耗費人力和物力,更別提開發了。但是,對於科大訊飛的財報來說,2013 年、2014 年和 2015 年,他們在營運層次和盈利層次,都碰到了不小的麻煩。
圖丨科大訊飛盈利能力指標(來源:訊飛財報)
科大訊飛營業收入增長小於營業成本增長,尤其在 2015 年科大訊飛的營業收入增長為 40.87%,而營業成本增長則為 49.49%,導致營業利潤率和銷售凈利潤率大幅度下降。
圖丨科大訊飛營運能力指標(來源:訊飛財報)
科大訊飛資產創造收入的能力不高,有大量的資產處於閑置狀態。科大訊飛的流動資產周轉情況和應收賬款回收情況也不樂觀。此外,在 2013 年至 2015 年期間,存貨周轉率逐年降低,說明存貨的增長速度高於主營業務收入的增長水平。
綜上,2013 年到 2015 年期間,科大訊飛業務收入總體水平不理想,而且收入不能為企業提供足量的現金流入,資金鏈條十分脆弱,容易發生財務風險。在營運層次方面,科大訊飛的資產周轉更為糟糕,企業沒有充分利用資產進行盈利。
科大訊飛的研發支出一直在 20% 以上,不過這筆錢有很有一部分是資本化支出,費用化和資本化的區別在於:資本化支出計入形成資產的成本,通過折舊攤銷在使用期內扣除,而費用化的支出就是當期發生就一次性計入當期損益中,以後不再扣除。
有網友諷刺稱,2017 年訊飛 11.45 億研發支出,其中有 5.5 億是資本化支出,佔比 47.96%,上一個佔比 50% 左右的企業是樂視。事實上,行業的研發支出資本化率平均水平為 5.78%。
這些產品著實讓科大訊飛有了牌面,光是其百度指數就足以說明。
圖丨科大訊飛百度指數(來源:百度)
然而,事實可能並沒有那麼令人興奮,其收入增長與利潤增長落差越來越大,而且在扣去政府補貼後,公司的營運狀況的確實也讓人感到憂慮。這其實是所有在科技創新這條路上摸索前進的公司都會遭遇的狀況,而科大訊飛也是如此。
所以,科大訊飛不僅是為了要面子,更或許是為了保住自己的飯碗。若是其主力產品「訊飛聽見」無法得到社會範圍內的重視,甚至是因此被嚴重質疑,那麼迎接科大訊飛的可能是極為嚴峻的挑戰。
發展與活下去
對任何企業來說,「活下去」這句話都是擁有啟示性的,更別提發展迅速的科大訊飛了。2018 年 5 月 14 日,科大訊飛發布《非公開發行預案》,擬向不超過 10 名特定對象非公開發行股票不超過 1.08 億股,募集資金不超過 36 億元。,意圖繼續發力人工智慧領域。該公司 5 月 14 日至 5 月 16 日股價則呈斷崖式下跌。
此前有觀點表示,目前訊飛最強大的護城河,不是語音技術,而是政府採購、教育等事業單位採購而建立起來的客戶關係。
DT 君不完全贊同這種觀點,畢竟科大訊飛的市值仍然很高,這代表市場認可科大訊飛具備技術優勢和市場空間。但是,其資本是否能轉化為技術,同時在市場上保持領軍地位,便成為了不少人聚焦的問題。
(來源:百度)
根據公開信息,王小川的搜狗已經不滿足於語音識別了,他們為了追求更高的效率正在研發「唇語識別」技術;阿里更是直接把語音識別做成了音箱,用市場來鍛煉其能力。不能一輩子吃老本,況且 BAT 三家對語音技術的強勢投入,讓科大訊飛陷入了四面楚歌的境界。
避雷針的發明者本傑明·富蘭克林曾說過:「大船可以去遠處探險,而小船不應該遠離海岸。」科大訊飛一直都想成為一艘大船,引領語音識別,乃至整個人工智慧行業。但是只有奮發圖強、貨真價實的態度,才能讓企業長存。
推薦閱讀: