網易雲易盾CTO朱浩齊:我們是如何用AI賦能內容安全?
5月19日,LiveVideoStack攜手網易雲易盾,共同打造了「娛樂多媒體開發應用實踐」專題,幫助開發者和泛娛樂平台運營人員,提升技術能力,突破難點,拓展思路與視野。
在專題論壇中,網易雲易盾CTO朱浩齊分享了《AI賦能的內容安全技術實踐》主題內容,從策略、技術、產品三個方面,詳細介紹了網易在內容安全系統構建方面的實踐經驗,包括如何建立對有害信息精細明確的審核體系和應急響應機制,如何採用基於自然語言、深度學習技術的智能識別技術,保證對文字、圖片、語音,特別是直播視頻內容的全面精準覆蓋等等。
內容安全行業現狀:有害信息的持續性遞增
2017年全球網民34億,互聯網普及率46%;全球智能手機保有量28億;2016年互聯網佔據了中國用戶55%的媒體時間;移動互聯網使用時長超過電視......這些數字都在表明,網路直播的變現能力已遠遠超過遊戲、電視等其他媒體。
朱浩齊表示,互聯網進一步滲透人們生活各個角落的同時,也還帶來有害信息的持續性遞增——各種違法和不良信息的舉報量居高不下,甚至引起了國家戰略層面的關注。
沒有網路安全,就沒有國家安全,更不能讓互聯網成為傳播有害信息、造謠生事的平台。因此,近年來,各種處罰案例也是不勝枚舉。
這位網易雲易盾CTO列舉到:2017年4月18日,北京市網信辦、公安局文化場行政執法總隊聯合約談今日頭條、火山直播、花椒直播;2017年4月底,國家新聞出版廣電總局責令騰訊整改微信公眾號、移動客戶端播放視聽節目;2017年6月22日,廣電總局責令關停新浪微博、AcFun、鳳凰網等站的視頻服務;2017年7月,bilibili大量劇集被下架;2018 年4月6日;為了配合廣電總局的整改,快手擴容自己內審核團隊;2018 年4月8日,廣電總局責令今日頭條永久關停「內涵段子」等低俗視聽產品......可以說,行業進入了強監管時代。
「對於企業來說,內容安全更是成為了刻不容緩的生死命題。」朱浩齊舉例稱,今年4月,文化部和旅遊部公開文件顯示已排查4939 款直播應用,下架370款。「所以,多款直播應用平台都選擇了加大審核力度和人工投入。」例如,快手發布招聘顯示將審核人員規模擴充到5000人,月薪4000-9000元;今日頭條也表示近期將擴充到6000人審核團隊,預期到達10000人......
朱浩齊認為,互聯網直播平台的內容安全給企業帶來的挑戰遠不僅如此,在成本、效果、技術上,各種挑戰維度都在不斷升級,更是給企業帶來了極大的困難。
網易雲易盾如何在技術層面提供安全防護?
分享完嚴峻的形勢後,朱浩齊和大家談了下擁有20年技術沉澱的網易雲易盾是如何做內容安全的。
他說,易盾在內容安全上,一共經歷了三個階段:
- 階段一:關鍵詞、黑白名單、過濾器;
- 階段二:內容特徵識別(膚色,紋理)、貝葉斯過濾、相似度匹配、規則系統;
- 階段三:大數據分析(用戶行為,用戶分類)、人機識別、人工智慧(語義識別,圖像識別、自然語言處理等)。
現階段文本、圖像、語音、視頻四塊都有哪些核心技術?朱浩齊表示,主要有以下這些:
- 文本:智能關鍵詞、模糊匹配、語義分析、小語種檢測;
- 圖片:圖像識別、特徵識別、圖片檢索、OCR 識別;
- 語音:MD5庫檢測、語音特徵檢索、語音特徵識別、語音識別;
- 視頻:視頻轉碼壓縮、視頻流分析、截圖/截幀分析。
這位深耕於技術一線的CTO表示,得益於神經網路學科的快速發展,近年來的機器學習技術也在不斷進步,為內容安全提供了最堅實的技術保障,包括分層的生物神經網路、圖像識別技術、深度神經網路、神經元激活熱力圖等等,在安全技術效果上給予了更多的強化。
Hubel& Wiesel(圖片來源:Harvard Brain)
他說,這些技術也在網易易盾中得到了充分應用,包括圖片識別、音頻過濾以及視頻過濾技術。
- 圖片識別技術:支持人像識別,支持色情圖片檢測,支持動漫識別;支持相似匹配,支持圖片旋轉、裁剪,支持改變圖片亮度、色調;支持水印識別。
- 音頻過濾技術:基於強大的語音識別分析引擎,通過網易積累多年的垃圾庫實時過濾有害語音,同將轉成文字進一步過濾。技術要點在於,將語音轉換文本和文本檢測相結合。
- 視頻過濾技術(直播、點播):視頻流檢測,視頻截圖/截幀檢測,直播間熱度監測,主播黑名單,機器+人工。技術要點在於,將視頻轉換圖片和圖片識別技緊密結合。
對於網易來說,內部數據的多樣性也給易盾提供了豐富的實踐場景。「在網易郵箱、網易新聞、雲音樂、LOFTER、雲相冊、薄荷直播等內部應用構建的數十萬變種的數據中,易盾能夠實現實時加密過濾垃圾信息、安全防刷等功能,良好地維護了產品運營氛圍和用戶體驗。」
真實的技術環境更為複雜,網易易盾如何更進一步?
事實上,從技術、人力、成本等各維度來看,真實環境中的內容安全防護更為複雜。舉例來說,假設10k張圖像中有1張是違禁圖片,易盾的系統準確率為99.9% ,即1k張圖像會判錯一張,那麼其計算偽陽性率(False Positive Rate,即判斷為違禁圖像集合中正常樣本的比例)為:
即11 張判定為違禁的結果裡面竟有10張是誤判的——數據的難解釋性、黑客的持續性攻擊都給內容安全防護提出了更高的要求。
- 難解釋性:如下圖所示,一張原本能被正確識別的大熊貓圖像,在添加人眼幾乎不可辨認的微小變化之後,竟然以99 .3%的置信度被判別為長臂猿。
- 黑客攻擊:通過對輸入數據的維度特性進行改變,可以針對深度學習數據處理環節進行攻擊,對深度學習圖像識別等應用造成逃逸攻擊以及數據污染攻擊等效果。比如說,下圖某位明星,經過數據的維度特性處理後,它能被機器識別為「某本山」。
更遑論,內容安全的「攻擊者們」早已形成了成熟的產業鏈。他們這類徘徊在法律邊緣的群體,利益明確且分工協作,攻擊手段更是持續升級。所以,對於所有的內容安全廠商來說,這都是一場高成本、長拉鋸的攻堅戰。
朱浩齊說:「基於此,易盾對比行業傳統的內容識別單維度服務,還提供了賬號、IP、行為動作(關注,投票,評論)、內容識別、用戶畫像、群體畫像、環境數據、設備指紋的多維度技術服務。此外,更是深入解析攻擊漏洞,從註冊保護、登錄保護、環境監測、行為分析、用戶分析、離線計算的全服務流程進行深度的安全防護。」
目前,基於網易所構建的強大用戶關係網路,易盾提供了場景化的解決方案。從廣告過濾、智能鑒黃、暴恐識別、謠言排查四大方面,實現了彈幕實時過濾、聊天區文本/圖片過濾、頭像/昵稱過濾、直播間電視牆監控、直播間音頻過濾、主播黑名單、用戶黑名單、房間熱度分析等全方位的安全防護功能。此外,「機器+人工」的操作模式,更是從細微之處著手,提供了升級化的技術功能,智能機器監控、優先推送、智能排序、嫌疑高亮、支持警告、斷流操作、自動補位、視頻大小自適應等等不一而足。
重重的技術防禦下,安全效果自然不言而喻。朱浩齊分享到,目前易盾每天為網易數億的用戶和內容數據提供安全保障,也給網易所有得產品提供了全面的信息安全服務。「在今年三月份主要商業網站違法不良信息的舉報統計中,易盾全面的信息安全服務為網易的產品帶來了效果顯著的保護。」他說。
如何快速使用易盾?
網易易盾,是極速智能的內容安全雲服務,專註內容安全解決方案。目前,網易易盾已在泛娛樂、多媒體、運營商、電商、金融證券等各行各業實現滲透應用,多領域客戶覆蓋下,是秉持初心、堅韌不破的安全技術保障。
現在,通過API 接入,訪問 http://dun.163.com,一天即可配置完成。
內容安全數據可視化、智能的直播電視牆、身經百戰的審核團隊,豐富的功能應用,現在即可獲取。
推薦閱讀:
※如何看待前CTO馮大輝和現CTO范凱robbin 的決裂?
※CTO的職責是什麼?
※好的CTO應該具有的七個品質
※作為非技術背景的創始人,你希望找到一位什麼樣的 CTO?