Google黑科技系列 3 —將圖片變成視頻的技術Deep Stereo
谷歌黑科技可真多啊,本期主題依然是在圖片上做文章,谷歌工程師John Flynn發表的論文,實現了圖片變成視頻。
論文下載:DeepStereo: Learning to Predict New Views from the World』s Imagery原文地址:The Latest Google Algorithm Creates Video Based On a Few Still Images
下面是對上文的簡單翻譯(由於知乎不支持動圖,所以下面以連接的形式附上,大家也可以看原文):
動圖
Google的工程師可以使用其開發的技術做一些令人難以置信的事情:從基於計算機視覺的「夢想」神經網路(比如Google的夢想機器人),到本期的可以根據圖像生成視頻的演算法。
2015年7月,麻省理工學院刊登了Google工程師John Flynn的文章,論文的四個作者都在Google工作,文章詳細闡述了他們如何開發一個名為DeepStereo的系統,此系統可以查看某個地方的一系列圖像,並將它們組合成一個無縫的3D視頻。
動圖
早在DeepStereo之前,就有類似利用靜態圖片輸齣動畫的技術存在。美國計算機協會計算機圖形專業組(SIGGRAPH)就曾通過網上圖像製作過延時動畫。但與其他靜態圖像生成動畫技術相比,DeepStereo系統最大的不同在於,它可以猜測出圖像的缺失部分,在空白處創造出來源圖片中沒有的新圖像。
據英國媒體Register報道,和傳統動畫利用視覺暫停的原理不同,DeepSteoreo可以「想像出」兩幅靜止圖像之間的畫面。 Flynn和他的合著者在論文中寫道,「這項技術與之前的產品截然不同,我們嘗試採用新型深度架構直接合成新圖像,不需要預先設置景深、焦距等訓練數據。」
仔細觀看下面視頻,你會看到視頻角落的畫面很不清晰。「演算法沒有涉及到的區域往往是模糊的,無法被覆蓋,也無法使用像素填充,」開發團隊解釋說。不過,這套系統暗藏了一個通過模糊的圖源生成物體的小技巧:「移動對象在訓練數據中非常常見,我們的模型可以優雅地完成這個動作:開始出現的時候是模糊的,然後逐漸轉換為運動模糊效果。」
預覽視頻:DeepStereo Learning to Predict New Views from the Worlds Imagery
好了,今天就說這些。
往期:
Google黑科技系列 1:低解析度圖片高清重建
Google黑科技系列 2:馬賽克猜想
------------------------------------------------------------------------------------------------------------------------
from 微信公眾號:wnsouba
推薦閱讀:
※一階邏輯在知識圖譜的知識推演中作用,如何獲取一階邏輯? 華盛頓大學的Sherlock系統誰用過?
※《西部世界》的 AI 太老派?也許平凡而努力的人工智慧才是真實的未來