直播,CycleGAN,視頻換臉,未來的現實

直播現在很火熱,它滿足了人們通過互聯網更深度交流的慾望。做直播網站的成本除了技術、機器,主要是網路帶寬,越清晰,帶寬成本越高。阿里雲上3M帶寬的機器價格是1M帶寬的3-4倍,而視頻直播需要的帶寬至少要10M、20M,是個非常耗費帶寬流量的應用。

不過我最近發現一個很有趣的事情,就是直播實際上是可以偽造的。通過深度圖像風格轉換,可以將一個大糙男人換成一個香嫩美女,這就是技術的力量啊,哈哈??

https://www.zhihu.com/video/902268205568004096

左邊是原始視頻,右邊是經過演算法轉換的視頻。

這個演算法叫做 CycleGAN,用生成對抗網路轉換每一個像素點,上層用 keras / torch / lasagne 實現:tjwei/GANotebooks

那麼我們可以想像,實際上當流量、帶寬在未來越來越便宜,我們通過互聯網視頻與人溝通的場景將會越來越多。文字的互聯網發展到現在,我們已經看到了許多匿名偽造、身份欺騙等事,因為我們很難辨別文字背後到底是誰,所以互聯網早期的網民發言大多以宣洩對生活的不滿為主。

視頻直播看起來更真實一些,但其實也可以偽造,而且你很難發現這一點。那麼我們未來是不是想看到什麼,電腦就可以立馬計算出來呢?我想差不多是這樣的,未來的視頻也不限於目前的平面屏幕,會有3D全息、VR,更有「感覺」,但都是計算出來的,既然是計算出來的,就有可能是「假」的。

不過話說回來,我們真地那麼在意」真「和」假「嗎?當我們不知道的時候,我們根本沒法知道」真假「,you don"t know what you don"t know,就是這個道理。真假已經難以分辨了,於是也就不再有真假了,判斷標準會變化。

我想這種技術,既然被我們普通人看到,應該早就已經被用來盈利了,比如很多視頻網站、色情網站,每天需要大量的視頻內容,而這正好可以減少生產視頻內容的成本,簡直是完美的生意。還是那個觀點,生產需求推動著科學技術的發展,而人的慾望推動著生產的發展。

CycleGAN 相關的介紹:

Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks


推薦閱讀:

如何做好直播?
主播猝死事件,時間是遊戲主播最大的敵人

TAG:直播 | 计算机图形学 | 深度学习DeepLearning |