50張圖片做出李飛飛數萬張的效果,類腦AI竟然這樣玩?
來自專欄量子位54 人贊了文章
郭一璞 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
這張毛色艷麗「星空貓」,在經過圖像處理之前長這樣:
沒有了迷幻背景和油畫般的毛色,頓時變成了三隻「凡貓」。
一個不懂GAN也不會PS的普通人,完成這樣的圖像處理要幾分鐘?
在微信通訊錄里鎖定設計師大神……1分鐘;
組織語言求大神幫忙……5分鐘;等大神回復……30分鐘;大神發來了他的報價……卒。
但是對馬卡龍玩圖的用戶來說,只要點幾下屏幕就夠了。
上傳原圖,APP自動摳出三隻貓;
把背景和貓的渲染風格都設置成星空;降低貓的亮度,提高貓的對比度。
三步完成只有設計師才能做出的效果,依靠的是馬卡龍玩圖APP背後的類腦人工智慧技術。
一家「沉迷」類腦的AI公司
馬卡龍玩圖APP之前的名字叫Versa,和背後的這家公司的名字一樣。
作為一家專做「P圖」的AI創業公司,Versa的研究方向和別家不同:
不做大數據人工智慧,專做類腦人工智慧。
Versa的CTO趙維傑向量子位介紹了他們的研究方向和特點。
類腦人工智慧和基於大數據的人工智慧不同,是機器學習的另一個分支,研究類腦計算,以及概念表示、遷移與生成,和腦科學的關係更近一些。
相比依賴大數據進行模型訓練的神經網路,類腦人工智慧可以實現和人類小孩認識世界類似的能力,僅僅通過少量數據就可以實現一些效果。
比如說,李飛飛2016年的ECCV論文《Perceptual Losses for Real-Time Style Transfer
and Super-Resolution》用到的方法,實現每種風格需要4~8萬張圖片來進行訓練,而Versa的通過類腦人工智慧進行風格遷移,每種風格只需要50張圖片就可以了。
而概念遷移則是類腦人工智慧的另一個優勢。拿圖片來舉栗子,概念遷移是指可以將顏色、形狀等基礎概念,加上語義,拼接成複雜概念。
作為一家以P圖為核心的公司,類腦人工智慧便於實現概念遷移的特點也讓Versa在「摳圖」這個步驟中取得了優勢,趙維傑自信滿滿的說他們的準確率超越了谷歌的Deeplab V3+大約5個百分點,達到了95.7%。
類腦人工智慧的第三個優勢「無中生有」被Versa用在了姿態估計上。
通過單目攝像頭拍攝出的景象,類腦人工智慧「腦補」出景深,可以方便實現3D姿態估計。
類腦狂人趙維傑
說趙維傑是個類腦狂人一點也不為過。
目前,趙維傑不僅是Versa的CTO,還是Versa和上海交大的腦科學與人工智慧聯合實驗室主任。
早在2012年,趙維傑就已經開始研究類腦人工智慧方向了。
在他看來,依靠大數據的人工智慧只能解決一小部分問題,比如圖像識別等;而在更廣闊的應用場景中,人們無法獲得如此大量的數據,只能靠類腦人工智慧來解決。
而類腦人工智慧本身的概念遷移能力,更讓研發的速度足夠快。「任意一個基於腦科學的AI公司,都非常容易建立起長期的技術壁壘,」趙維傑說,「假設說現在我們的圖像分割演算法可能領先行業六個月的話,那我們下一個演算法一定領先行業要一年。」
這也讓趙維傑找到了自己的創業方向——不是安防、醫療這類基於大數據人工智慧的偏B端生意,而是服務更多人、更加多元化的文化產業,通過便捷的圖像處理,讓不管是設計師還是普通人都可以享受到AI帶來的方便和樂趣。
或許,這也是一個AI創業的靈感:誰說底層技術必須服務於B端?
趙維傑告訴量子位,目前Versa在APP端已經擁有1200萬用戶,未來準備繼續在C端通過馬卡龍玩圖APP服務普通用戶,在B端通過Adobe插件的形式,服務專業的設計師,讓設計師們不再花大量時間精力用在簡單的摳圖上。
One More Thing
Versa給量子位展示了馬卡龍玩圖APP下一個版本即將上線的新功能,名叫inpainting,可以一鍵P掉照片里的人物。
注意「仙人洞」中的那個白衣女子。
不見了。
另外,他們還準備把「摳圖」功能應用在視頻里,比如把這樣一段電影:
變成這樣:
你覺得效果如何?
最後,讀者朋友們對類腦人工智慧怎麼看?歡迎評論區留言。
— 完 —
歡迎大家關注我們的專欄:量子位 - 知乎專欄
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。
量子位 QbitAI· 頭條號簽約作者
?? ? 追蹤AI技術和產品新動態
推薦閱讀: