科技無障礙快訊 :人工智慧在無障礙領域的五個新思路
為了方便大家了解當下應用科技改善信息無障礙問題的案例,拓寬信息無障礙創新解決新思路,這裡特別收集了時下備受關注的創新科技,分享給關注信息無障礙的各位。
QQ空間圖片描述功能:讓視障者「看」圖片
日前,騰訊宣布在安卓版QQ空間客戶端融入騰訊AI Lab提供的"圖像描述生成"技術,讓視障用戶也可以「看到圖片」。
騰訊AI Lab圖片描述生成技術一般都是基於編碼器—解碼器框架。這一技術的難點在於設計出能夠充分理解圖像內容的模型,進而將相應編碼的圖像內容再「翻譯」成自然語句。
QQ空間團隊與信息無障礙研究會一直保持著長期穩定合作。QQ空間的圖片描述功能的靈感,來源於與信息無障礙研究會的一次日常探討,視障工程師提出的建議。
這次,QQ空間藉助AI技術,為圖片自動添加描述文本,能夠讓視障者通過讀屏軟體,以聽覺(讀屏軟體)、觸覺(點顯器)等感官了解圖片內容,在QQ空間這個社交場景實現了圖片信息的多重感官的傳遞。
QQ空間是國內率先將人工智慧應用在信息無障礙領域的社交產品。海外社交網站Facebook此前也推出了與QQ空間「圖片描述」相似的功能。
國內的信息無障礙優化,大多是基於對讀屏軟體兼容性的優化,而這次QQ空間團隊利用人工智慧技術升級產品體驗,讓各界人士看到了科技賦予更多信息無障礙的可能性。
谷歌MLCC課程:無障礙在線教育新思路
近日,谷歌推出了Learn with Google AI在線課程項目。其中「機器學習速成課程」(英文簡稱「MLCC」)已於 3 月 1 日上線,供全球人工智慧愛好者免費學習。
除了「免費」這個亮點,谷歌的的MLCC課程還有另外一個亮點:利用谷歌的人工智慧技術,英文講師的授課內容可以即時翻譯成包括中文在內的多種語言的語音。
技術原理是谷歌先把英文講師的語音轉為文本,後將文本翻譯為機器中文配音,並根據機器演算法按照講師的語速、停頓等即時播放機器配音。
用媒體「量子位」的說法是,在線課程做成了譯制大片的既視感。
這項在線課程即時翻譯配音功能惠及的是眾多自稱「英語廢」的學習者,以及包括視障人士、讀寫障礙人士在內的障礙人士,為無障礙在線教育提供了新思路。
雖然學習MLCC的課程需要一定的高等數學和編程基礎,有一定的學習難度,並且因為機器翻譯的緣故會有一些翻譯上的誤差,但這仍然是一個讓人為之鼓舞的好消息。
試想,如果日後有人工智慧作為同聲傳譯助手,包括障礙人士的所有人便能第一時間享受到國內外先進課程的資源,通過自主學習實現自我提升。
天使眼:「共享助盲眼鏡」計劃
在國內,由上海肇觀電子科技有限公司生產的「天使眼智能眼鏡」是為視障人士熟知的電子科技產品。
天使眼智能眼鏡前方雙目立體攝像頭模擬人眼採集前方物體位置信息並轉換成聽覺信號,再通過骨傳導耳機傳達,即時提示避障,自動定位導航、智能識別物體。天使眼同時適用於不同類型的視障人士比如全盲、低視力等,為視障人士提供安全、便捷的出行保障。
最近,官方還推出了天使眼「共享助盲眼鏡」計劃:通過共享天使眼智能眼鏡,為視障群體提供更便利的出行輔助,幫助視障人士安全避開日常出行時遇到的樓梯、坑窪、車、門、樹、欄杆、人等障礙物,並識別文字、鈔票、顏色、斑馬線和手機等常用物品。
肇觀電子作為一家專註於人工智慧和計算機視覺系統和晶元的科技公司,天使眼於2017年7月投入量產並面向全球發售,是世界首款採用計算機視覺及人工智慧技術輔助視障群體感知世界和出行的智能眼鏡。
來自官方的數據是:搭配天使眼智能眼鏡使用的天使眼APP下載量已經突破10萬次;2017年11月上線的天使眼導航功能已為視障人士提供82695公里的導航服務。
微軟Soundscape應用:輔助視障人群更好地探索城市
微軟從2011年起,就與英國導盲犬組織合作,一個「視障耳機」的概念,並且在過去的幾年,不斷改進新產品模型。
如今,微軟的這個項目有了新進展:微軟發布了名為Soundscape(音景)的新應用。
按微軟的官方說法,Soundscape應用是通過3D音頻技術,為視障人士提供地點導航和探索服務。
看了他們的官方宣傳視頻,可能更為容易理解一些:當開啟Soundscape應用,戴上立體聲耳機,使用者在路過包括商店在內的地標或道路時,Soundscape就會讀出地標或道路的名稱。
使用者也可以對自己本身熟悉的地方添加標籤,下次再經過同樣地方的時候,就會自動播報。
微軟稱,Soundscape不僅僅是為了輔助視障人士了解路況,更希望這款應用能讓視障人士更好地探索和發現城市。
目前這款應用已上架ios版本。
Oton智能眼鏡:解決閱讀障礙的黑科技
不知道明眼人小夥伴有沒有遇到過這樣的情況:看文本太久,眼睛累了,心想如果文字能自己朗讀就好了。
對於明眼人來說,文本自動朗讀可能是緩解疲勞的一種方法,但對於全球的讀寫障礙人士來說,卻是能解決很多實際的生活問題。
據外媒報道,日本Oton公司正在眾籌開發一款智能眼鏡,以解決讀寫障礙問題。
Oton智能眼鏡的鏡片內置有攝像頭,當使用者閱讀文本時,攝像頭會追蹤眼球並識別眨眼動作,眨眼的一瞬,Oton智能眼鏡會捕獲文本並上傳到專有雲系統上進行文本分析,然後轉為語音,最後通過眼鏡側旁配置的耳機進行播放。
如果系統無法識別或讀取文本,Oton還提供遠程人工服務。
據悉,創始人Keisuke Shimakage在東京大學讀書時,父親因腦梗塞損傷,閱讀文本時產生了障礙。
為了幫助父親,他投入到Oton眼鏡的研發設計中。後來父親痊癒,他還是堅持把項目完善,因為相信這個產品可以幫助到更多的讀寫障礙人士。
這讓人不由自主地想到,喬布斯也是因為自身的讀寫障礙問題,而在蘋果手機里開發了VoiceOver旁白功能。
無論是人工智慧、硬體革新,還是軟體升級,通過上面這些例子,我們可以看到:科技一直有著自有的溫度,不斷推動著社會公平、科技人文關懷的前進。
我們期待有更多的創新產品、應用、功能的出現,讓人與人之間,能無障礙地溝通,無障礙地生活,享受科技帶來的進步與便利。
推薦閱讀: