Hello, Vision
來自專欄視覺即智能
在《視覺與智能》專欄,我們將集中精力討論視覺科學研究。在這裡,我們從視覺現象出發,探索隱藏的視覺問題,了解視覺系統的功能和可能使用的演算法。歡迎各位與我們一起重新認識視覺的智能——如何對進入眼睛的物理信息進行加工和解釋。
視覺研究就是關於個體如何理解其看到的一切的故事。
可能有人覺得這其中沒什麼故事好講的。畢竟,視覺對於我們來說是如此輕而易舉。大多數時候,我們無需思考就能理解眼前所見的一切。這種「視覺易如反掌」的錯覺成功地誘騙了很多有識之士跳入視覺研究的大坑。最著名的要數20世紀60年代,以Seymour Papert提出的1966年MIT暑期視覺項目為代表[1],研究者們雄心勃勃地想一舉解決機器視覺加工的問題,三個月內實現智能人工機器視覺系統。
半個世紀後的今天,能比肩人類視覺的智能機器視覺系統仍然沒有出現。雖然風頭正旺的深度學習已經在技術攻堅和媒體公關的「共同努力和合作」下,在數個任務中打敗了人類,帶來了新一輪的全民人工智慧狂熱。但與生物視覺系統的複雜性相比,人工視覺系統的能力正處於一個「半杯滿,半杯空,公說公有理,婆說婆有理」的狀態。不過,不論如何看待機器視覺的發展,人們都從這半個世紀的探索中深刻地感受到了視覺的複雜與繁瑣。
在這個專欄中,我們當然沒法解決視覺加工過程中的複雜問題。我們希望從介紹各種(人類)視覺認知現象出發,讓大家了解到視覺不是一個理所當然、顯而易見的過程,也希望大家能體會到視覺的複雜性。有趣的視覺現象不僅令人驚奇,還能幫助我們思考視覺系統需要解決哪些問題。
從這些現象和問題出發,我們希望在專欄中介紹視覺系統的工作機制。與《認知即演算法》專欄不同,這裡並不採取固定的研究取向。因為在這裡,我們關心的是一切與視覺相關的問題。只要是能幫助我們了解視覺加工的,我們都希望去了解。不過鑒於我們的學術訓練背景,這裡仍然會以人類視覺計算理論和人類行為研究為主導。同時,我們也會選擇性地討論生物視覺系統的神經活動和人工視覺系統的演算法構造。每一個角度都能提供獨特的數據,不同的數據試圖從不同的層面回答視覺的問題。了解和比較這些數據,有助於我們了解哪些數據確實與視覺理論相關,哪些數據與視覺理論無關。
由於很多視覺問題與其他認知功能關係緊密,而且注意、記憶、決策和情緒等都會影響的視覺認知,所以我們也會在這個專欄中簡單涉獵與視覺相關的其他過程。
由於這個專欄會更多地介紹現象,所以這裡的文章會更加輕鬆一些。除了有趣的視覺現象與研究進展,我們也會關注和思考日常生活中討論的比較多的問題,並在合適的時候,合理地應用我們的基本研究知識加入討論。另外,我們也考慮在這個專欄中將基礎視覺研究延伸到其他領域的應用和擴展中。最後,我們也歡迎讀者向我們推薦有趣的視覺現象,如果能在其中找到好的問題和切入點,我們也樂意搜尋相關文獻與讀者一起討論。
與《認知即演算法》類似,這個專欄也會在工資發放日前後更新。不願透露姓名的編輯小姐姐同樣會負責催稿和文章質檢工作。最後,我們再次感謝各位關注這個專欄,請各位與我們一起了解「看見」。
[1] https://dspace.mit.edu/handle/1721.1/6125
專欄目錄
視覺認知現象
視覺加工與計算原理
Feitong Yang:所看到的,既是真實,也是虛幻人類視覺研究及其應用所看到的,既是真實,也是虛幻人類視覺研究及其應用
Feitong Yang:重構導播鏡頭(Directed Camera)——從視覺研究到遊戲開發
推薦閱讀:
※這年頭,你連吵架都吵不過AI了……
※為什麼號稱美女的機器人都穿得這麼土?
※2018年將是人工智慧的元年
※人工智慧對未來的預測越來越准了
※獨家對話CMU德撲AI賭神團隊:解密1+2技術架構,不攻反而不敗