世上最大的不可描述網站也向AI和機器學習勢力低頭了!

原文:《Pornhub is improving search with an AI porn addict》

翻譯:小馬哥

編輯:船長

常規的不可描述網站在 UGC(用戶產生內容)方面往往都面臨著一個大麻煩,那就是部分用戶在上傳視頻的時候常常不會按照資料庫的正常方式操作

就算設計產品時已經把用戶想像成傻子,還是會有出人意料更傻的用戶出現

這樣就帶來了一個問題:每當你打開網站,映入眼帘的就是千上萬個視頻,雖然全都使用了簡單辭彙和標籤描述內容,但內容往往重複。這就給用戶在搜尋視頻資源時造成了很大困擾,尤其是當你有特殊♂癖好,或者當你突然很想看某個特定的演員的作品時,比如最近聽說有新作即將發布的明日花老師。

如果一部解決不了你,那就再來一部。

為了解決這個問題,世界最大不可描述網站 Pornhub 計劃利用人工智慧技術將網站目錄里的全部視頻逐幀掃描和整理。

這套 AI 系統從成人演員身上採集了數千幅畫面和動作,以此構建了一個資料庫,含有人物名字、面部特徵和開車姿勢等信息,然後將收集到的數據和 Pornhub 系統中的視頻片段相比較,從而對網站視頻庫中龐大的視頻資源自動標記和分類。

唐馬儒再次面臨失業危機

更加令人側目的,是超越傳統意義上的「標籤」功能,系統會利用 CV 技術識別屏幕上任何時間點人物的名字以及任何姿勢,在 Pornhub 為科技媒體 Engadget 的演示中,演員邊以某種姿勢開車,屏幕上就會浮現相應的標籤,比如「咬」「牛仔女郎」「傳!教!士姿勢」等。此外,系統甚至還能識別出演員是不是金髮,是在室內還是室外,然後添加上相應的標籤。

當初求種像條狗的悲劇再也不會重演了,按標籤順藤摸瓜就可以

在此套 AI 系統正式上線前 Pornhb 對視頻分類的方式還是由人力來完成。Pornhub 希望在不遠的將來,用戶能夠觀看由其AI智能系統分類和標記後的視頻。屆時,假如你很想看某個成人演員的作品,AI 系統就會把所有它認為有這個演員演出的視頻片段展示給你,而且還會顯示此演員演出的百分比。

Pornhub 同時也會請求用戶幫助訓練 AI 系統,比如贊同正確的展示,反對錯誤的展示,使其逐步完善,準確度越來越高,想必沒有人能夠拒絕這個請求。

Pornhub AI系統工作方式:

  1. 從成人演員圖像中獲取數據
  2. 去除錯誤和模糊圖像
  3. 訓練機器學習模型
  4. 將模型在站內視頻庫中運行
  5. 通過反饋來優化和改進學習模型

迄今這套系統已經掃描了大約 50 萬部視頻,但 Pornhub 希望能在 2018 年初之前完成對所有視頻資源的掃描和標記工作。(還是別讓唐馬儒上了,估計會死)

Pornhub 最終希望能給用戶提供多種形式的產品,無論他們有什麼樣的嗜好,採用的新系統都能為用戶展示更準確的結果,提高用戶的回訪率。Pornhub 認為用戶搜索和找到資源越容易,他們的愉♂悅♂感就越高。

不過與此同時,人臉識別技術也引起了人們對隱私問題的擔憂。一些報復性的視頻常常會被上傳至某些知名的不可描述網站,還有些人發布了自己的視頻但想保持匿名。對此 Pornhub 稱他們採用的系統絕對沒有任何用戶隱私方面的隱患,因為軟體僅識別資料庫中的知名成人演員的臉部數據,不會識別非從業者,而且如果演員戴著面具或者臉部模糊不清的話,軟體就無法識別。這樣以來,一些戴著面具或者想保持匿名的演員的真實身份,外界就無法知道了。

儘管上述這一系列操作聽起來有點變態,但是 Pornhub 的 AI 系統本身的確功能強大。比如它還能發現和矯正人類操作造成的錯誤。

Pornhub 利用該系統可以發現低質量的重複視頻和一些資源的濃縮版,然後刪除。當然了,它最厲害的地方在於能夠利用 CV 技術,自主學習怎樣有效地自動識別和標記視頻,並添加描述內容。通過 AI 系統和機器學習,Pornhub 相信能夠提供更好的搜索體驗、更高質量的視頻和更少的重複資源。

要是登錄的門檻再低點,豈不..

向你推薦:

一文讀懂CNN如何用於NLP - 集智專欄

邊看邊練的簡明機器學習教程 Part II - 集智專欄

是直是彎?爆照判斷 - 集智專欄


推薦閱讀:

機器學習原來這麼有趣!第一章:全世界最簡單的機器學習入門指南
9評大公司-我看今日頭條
斯坦福發布人工智慧百年報告,預測AI如何在2030年改變人類的生活
推薦系統PM最主要的工作是哪幾件事?_討論輸出_AI產品經理大本營
報姐看片 | 女主神顏挽救一切!機器人談戀愛也好甜哦

TAG:Pornhub | 计算机视觉 | 人工智能 |