視頻網站是如何審查視頻內容的?
A關鍵字排查B視頻抽幀C人工審核等
具備上傳功能的UGC:
1、使用事先審查機制對視頻做審核; 2、對一些視頻抽幀來做審核;3、審核中有複審、QA環節保障審核準確率以及難以確認的視頻審核;
4、通過同一ID的上傳記錄過濾,對於某些高危視頻做重點審核; 5、會有同一文件合併,通過對文件名、文件大小的合併或過濾;其實會負責這塊的有幾個大類的人:比如廣電、宣傳部門的審核監察人員,視頻網站的審核團隊,提供雲審核服務的各種公司團隊等。
一般承擔視頻內容審核的主力工作的是各家視頻網站自己的審核團隊,簡單說一下自己了解的情況,各家公司情況不同,有不一樣的歡迎指出啦~
說幾個大家常見的誤會:
1、 關於傳言的90後高薪美女鑒黃師:不排除會真的有某些公司給人開這麼高的薪資,但是以實際而言,整體薪資水平而言根本沒有那麼高,工資是很低的……所以很多公司的審核or運營團隊會放在人力成本相對較低的城市。而且工作壓力很大,必須接受輪班倒班上班,全年24*365,加上每天都有打底的工作量要求,出錯了會有處罰,精神也比較緊張;
2、 之前看到其他問題里有人回答說國內視頻網站是「先發後審」,這個基本上可以說是不太可能的,廣電對內容審核有嚴格的要求,《審核通則》里的基礎要求必須是「先審後發」,哪家網站敢說自己先發再審就等著被約談把。(我說的是大的正常的視頻網站,優酷土豆愛奇藝這種)
所以理論上來說,優酷土豆、56之類的網站上看到的視頻都至少是經過1道(廣電要求2~3道)審核的。
3、 再怎麼審,也是有違規的內容出來的,但是不是說他就不違規了。A片還違規呢,難道你們都下不到a片了嗎?
審核的力度根據內容的不同其實是有區分的:
1、 花錢買的版權劇/電影/綜藝:國內的電影(有龍標的),電視劇、綜藝、動漫,基本上能過審的都沒什麼問題的。買國外的(引進境外劇)必須每年申報,上之前一般也會看一下,畢竟美劇很多不把漏點這種當多大回事兒。
2、 自製劇/合拍:自製節目必須備案,所以你們看很多網劇前面是有一串數字編號的。例如下面:
自製劇一般就是先去備案,然後自己拍自己審,由於是自己審,雖然大網站大部分尺度還拿捏的可以,但是偶爾也有被廣電要求重新處理的,比如搜狐的《屌絲男士》就被廣電要求重編過;《奇葩說》有兩期我記得廣電直接加到自律庫里說違規不允許播了。
3、 PGC/工作室內容:各家談的合作,比如飛碟說這種,現在做的比較好的內容都快被瓜分完了。對這類內容審核一般相對放鬆一點,但是他們的內容一樣會有撞槍口的。比如去年東莞掃黃的時候,上頭明確要求不允許上惡搞東莞掃黃的視頻,做搞笑的工作室上了一堆全撞槍口上了……
4、 Ugc:有ugc資質的最頭疼這個,這才是真的百花爭鳴……違規風險極大,完全不可揣測用戶會給你傳點什麼內容上來……
5、 其他網站弄來的內容:這個很正常,你家上了啥,我看到了不錯我也弄過來上一下。一般會審松一點,畢竟別人家都審過了對吧。不過這個各個網站背景不同尺度也不同,不要問我為什麼……像a站b站這種直接引用其他網站源內容的就相對省力一點。
審核步驟一般如下,各家技術和流程會有不一樣的,其實視頻基本還是靠人工來審,只是機器能篩掉一部分,ugc內容這塊:
1、 一般機器先篩一道,文字內容中含有敏感內容的可能直接就上傳不了(我記得之前優酷你傳視頻標題帶有「誘惑」就傳不上去);
2、 和違規庫中的內容比對,md5碼一樣的就被幹掉了;(md5碼一樣意味著是同一條視頻);
3、 人工審核:
一般是先對視頻抽幀截圖,有些有明顯問題的直接看圖就幹掉了(現在一些版權信息中心採用畫面比對的監測方式,不知道網站這邊有沒有在用)
初審工作量重一些,比較複雜難解決的問題一般丟給複審確認處理。
複審解決一些疑難問題,有些還要核對初審的工作。
人工審核意味著某些問題的判斷上存在不確定性,這就是為啥有的人傳2條一樣的視頻,一條過了審一條沒過。
人工審核做的工作一般有幾點:
1) 視頻過審/不過審;
2) 修改部分內容:有些視頻本身沒問題,文字內容有問題的可能會修改一下;
3) 給視頻分級:好的推薦,差的雖然過審但是降低搜索權重/隱藏。
有些天天傳亂七八糟視頻的已經上了黑名單的高危用戶,基本上被刪的概率還是非常之高的。優酷審的慢是因為他新增內容多,我記得去年說已經每天新增十幾萬條了……
4、人工審核以後基本上就指望前端審核,用戶舉報了……根據半夜流量高的一些視頻和熱搜詞其實能打開新世界的大門……
審核內容這塊:
1、 最基礎的是要遵守《審核通則》裡面「十不準」「十一剪」的。這個有興趣的同學可以自己搜一下;
另外廣電有一個自律庫,裡面定期發布一些違規視頻,大概快小1w條了。
2、 各種上級主管部門:廣電,宣傳部,網安,網信辦,網警,文化部(年初包括《東京食屍鬼》《進擊的巨人》違規是文化部執法大隊說的)臨時發的各種通知,比如基督教廣場舞內容不予傳播,偶爾上級部門也會直接丟過來幾條你家網站鏈接說違規麻煩下了……
3、 特殊敏感時期:
每年快年中那一天(你們懂的),各家有ugc資質的都如臨大敵,生怕不小心上了晚會的某些片段那就直接跪了。
有些熱門事件發生後,比如之前昆明暴恐發生以後,當時各網站都死去活來的加班把看不懂拿不準來源的小語種(尤其是少數民族語)的內容給下了,寧殺錯不放過。畢竟網站開門做生意的,安全運營這種事,啥都不發生沒人關注你,一發生就是要關站的大事了。
不同時期上級尺度也是不一樣的,比如兩會期間,x網行動期間,可能平時沒問題的視頻這段時間就不行了。
4、 有一些不是違規的,但是比如友商有版權的,人家簽了獨家的,你也不能過。
5、 一些雜七雜八的小要求:比如長時間出現境外媒體台標的,視頻上有新x人麥克風標誌的(電視上放的娛樂新聞偶爾都會有沒遮住的,這種屬於嚴重政治運營事故了);
說下個人感受:
1、 上級主管部門還是有很多能人在的,畢竟我本人真的是聽不懂葛XX吉,根XX沖的歌曲的;
2、 比較大的網站,都有專人在查你的,有些放的超級深平時沒人看的視頻都能被他們查出來……
3、 有時候我感覺我就是個敏感辭彙表,比如我其實特別不能看「萌「這個字……
4、 最頭疼的其實是擦邊球內容:露點的就直接處理了,色情擦邊球的其實很難判斷,你說揉胸就算違規,揉胳膊就不算違規嗎?全裸要刪,那穿著丁字褲就可以過,但是丁字褲難道不就是個象徵意義嗎……
5、 自從做了這塊工作,團隊人越來越多,真的是有一種打開新世界大門的感覺,各種戀老戀童冰戀BL戀足這都不算什麼,還有口味更重更奇葩的。
暫時先想到這麼多啦,TnT
當過視頻審核員的人默默飄過
視頻分好多類:
1.版權類:就是涉及到版權問題的 比如優酷是版權方 那就不能上傳到其他視頻網站2.合作方:為了保護合作方的利益 此類視頻也不能ugc用戶上傳。3.時事政治類:高危超高危 要不小心過一個 你就等著挨批吧4.宗教類:法輪功啊 balabala……還有其他很多類 不記得了5.社會敏感問題:比如拆遷 城管6.色情:有裸露鏡頭7.自製視頻:非法集會這種8.暴力血腥類暫時就想起這麼多做過這方面研究,也在同伴在這方面工作,簡要回答下我們的工作流程:
流程上首先對內容HASH比對,HASH比對歷史庫(已確定數據)沒對上的,匯聚分析,並對視頻進行機器分析,我的專利演算法,誤殺漏殺比較高,好處是快,資源佔用少,可以用機器處理大部分內容結合行為特徵分析,如用戶ID信用等級,操作特徵,識別準確率非常高的評論內容文本分析,傳播量高的優先人工審核,行為等級低的先發後審等,後邊還有各種處理策略,以及對策略的自動化升級優化,幾年下來基本保證沒出過內容方面的事故,而且人工投入也不高對於視頻審核,涉及幾個方面:
1:網站利用技術,系統自動屏蔽一部分,通過MD5白名單自動通過一部分,不過通過的也還是要人工在審核一遍,可以批量審核。
2:剩下的內容都是人工審核的,好多人說的人工智慧審核智能替代一部分人員,以目前的技術不可能都利用人工智慧,要知道人類的語言太博大精深了,很多隱晦的內容需要人員判斷。目前主要方式就是人工審核視頻。玖壹六文化傳播(北京)有限公司有一個專業的審核團隊,可以實現7x24小時實時審核。
對於常規的視頻審核,例如鑒黃等,可以使用自動化實現,但是對於一些涉政,以及一些少數民族語言的違規視頻,目前主要方式為人工審核視頻及直播。北京聖陽易信科技有限公司有一個專業的藏語審核團隊,可以實現7x24小時實時審核。
像優酷、愛奇藝、騰訊視頻等大視頻網站,視頻審核人員得多少人
網易開發的一個產品網易易盾,可以智能審核視頻,準確率挺高,可以了解下
推薦閱讀:
※2012年為什麼 Netflix 沒落了?
※搜狐視頻的「版權獨播」與「台網聯動」策略有可能成為行業主流嗎?為什麼?
※AcFun 是怎麼把一手好牌打到如今這個地步的?
※依靠互聯網商業播放平台起家的公司是否會取代傳統的電影製片公司?
※伍聲2009做的最好的視頻是哪幾部?為什麼?
TAG:視頻網站 |