Google黑科技系列 3 —將圖片變成視頻的技術Deep Stereo

01-25

谷歌黑科技可真多啊，本期主題依然是在圖片上做文章，谷歌工程師John Flynn發表的論文，實現了圖片變成視頻。

論文下載：DeepStereo: Learning to Predict New Views from the World』s Imagery

原文地址：The Latest Google Algorithm Creates Video Based On a Few Still Images

下面是對上文的簡單翻譯（由於知乎不支持動圖，所以下面以連接的形式附上，大家也可以看原文）：

動圖
Google的工程師可以使用其開發的技術做一些令人難以置信的事情：從基於計算機視覺的「夢想」神經網路（比如Google的夢想機器人），到本期的可以根據圖像生成視頻的演算法。
2015年7月，麻省理工學院刊登了Google工程師John Flynn的文章，論文的四個作者都在Google工作，文章詳細闡述了他們如何開發一個名為DeepStereo的系統，此系統可以查看某個地方的一系列圖像，並將它們組合成一個無縫的3D視頻。
動圖

早在DeepStereo之前，就有類似利用靜態圖片輸齣動畫的技術存在。美國計算機協會計算機圖形專業組（SIGGRAPH）就曾通過網上圖像製作過延時動畫。但與其他靜態圖像生成動畫技術相比，DeepStereo系統最大的不同在於，它可以猜測出圖像的缺失部分，在空白處創造出來源圖片中沒有的新圖像。
據英國媒體Register報道，和傳統動畫利用視覺暫停的原理不同，DeepSteoreo可以「想像出」兩幅靜止圖像之間的畫面。 Flynn和他的合著者在論文中寫道，「這項技術與之前的產品截然不同，我們嘗試採用新型深度架構直接合成新圖像，不需要預先設置景深、焦距等訓練數據。」
仔細觀看下面視頻，你會看到視頻角落的畫面很不清晰。「演算法沒有涉及到的區域往往是模糊的，無法被覆蓋，也無法使用像素填充，」開發團隊解釋說。不過，這套系統暗藏了一個通過模糊的圖源生成物體的小技巧：「移動對象在訓練數據中非常常見，我們的模型可以優雅地完成這個動作：開始出現的時候是模糊的，然後逐漸轉換為運動模糊效果。」
預覽視頻：DeepStereo Learning to Predict New Views from the Worlds Imagery

好了，今天就說這些。

往期：

Google黑科技系列 1：低解析度圖片高清重建

Google黑科技系列 2：馬賽克猜想

------------------------------------------------------------------------------------------------------------------------

from 微信公眾號：wnsouba