看「少女老婦圖」的時候，為什麼一次只能看到一個人物？

12-09

來自 http://www.http://zhihu.com/question/20135153 中@山醒的答案評論中@薛苗提出的問題。

認識的」整體性」。
有沒有這樣的經驗，會把兩顆星星加一彎月亮看成一個人臉？我們對事物的認識是若干元素綜合後處理得到的結果。少女老婦圖中，組成少女和老婦形象的元素有重疊，這些元素在大腦處理時無法做到同時具兩個屬性，即使，在@墨磊的提示下我意識到二者重合的元素了，我還是無法把這團畫作同時當作兩個人，因為我"辯認出一張臉」的過程需要"認出」眼睛、嘴巴及鼻子，鼻子/嘴巴的存在讓我的大腦困惑，於是我必須決定"這個元素是」鼻子或嘴巴。
我們對"臉」的抽象認識包括其上特徵性五官按照一定位置規律的排列，五官的屬性（比如眼睛還是嘴巴？）須要明確，我們才能對"這是不是一張臉」作出判斷，從而實現"認出一張臉」。
關於臉的辯認心理學家做了很多研究，記得有個結論好像說嘴是最基本元素？求達人深入講解。

不同意上面的人臉識別的角度, 如果這張圖片是別的雙歧圖案, 也是同時只能看成一個. 人腦對圖像的識別應該是簡單的記憶讀取,用已有的概念去匹配當前.現在神經科學認為,大腦的記憶儲存於單個神經元中,是細分的, 也就是說你腦子裡有那麼幾個神經元是針對字母A,有那麼幾個是針對老媽,有那麼幾個是針對老爸, 那麼當一個圖案出現時, 幾個神經元被同時激活,但他們電流到達大腦輸出判斷的接收器有快慢之分.所以一次只能1個.把大腦想像成電腦顯示器, 無論你做到多麼同步得打開2張圖片,最終現實在前面的還是只能有一張.

當知曉如何看成少女、如何看成老婦的時候，
貌似可以同時看出了吧。

少女的項鏈、老婦的嘴；
少女的臉頰、老婦的鼻子；
少女的耳朵、老婦的眼。

用計算視覺的角度看，所謂的知覺的穩定性和整體性，其實是人腦自動運用了最大似然推斷的結果。

簡單來說，視覺的知覺其實是我們的大腦對圖像在視網膜上成像的解釋過程，而我們更傾向於去把感受到的圖像信號解釋為最可能出現的東西，和/或某個最可能表現成感受到的圖像的東西。
這可以解釋，為什麼有些人會在很長一段時間內，看這個少女老婦圖的時候無論如何看不到另一種解釋。比如說我覺得看到少女更加容易。一種解釋是，如果我心中總想著少女，而非老婦的話，會總是看到少女（我認為少女是更可能出現的東西）；另外一個解釋是，我認為少女比老婦更可能表現出如圖所示的樣子。
這樣說來，回到樓主的問題，就很容易理解了：我們似乎沒有什麼理由相信，這個圖像可以解釋為少女和老婦的疊加，如果這是可能的，那麼需要一個非常恰好的少女，和一個非常恰好的老婦，站在非常恰好的位置，被你非常恰好的看見。而這樣事件的概率實在微乎其微，特別是從她們出現的時候呈現出這個樣子的概率的角度看。

複雜一點說，需要用到貝葉斯定理。假設人感受到的圖像是I，那個物體本身是S，那麼我們大腦做的工作其實是I-&>S，即由圖像推斷物體是什麼，寫成概率就是P(S|I)，由於S是基於I推斷的，此概率常被稱為後驗概率。根據貝葉斯公式，P(S|I)=P(I|S)*P(S)/P(I)。在這個公式的右側，P(I|S)即是某物S呈現出特定圖像I的概率，常被稱作似然概率（或相似度），而P(S)即是人預先認為S物出現的概率，被稱作先驗概率，P(I)則一般被當做標準化常量。
根據這一公式，我們即可以發現，人腦其實自動在眾多備擇的物體（S1=少女，S2=老婦，S3=少女+老婦，等等等）中進行概率判斷，並選擇了P(S|I)最大的那個S作為知覺到的內容。並且，我們其實是要選擇似然概率P(I|S)和先驗概率P(S)的乘積最大的那個S。再回頭看「簡單來說」里的內容，似乎就非常容易理解了。

以上只是個人對計算視覺的粗淺理解，歡迎各位大牛指正。

參考內容：
維基百科貝葉斯定理詞條
http://zh.wikipedia.org/wiki/%E8%B4%9D%E5%8F%B6%E6%96%AF%E5%AE%9A%E7%90%86

我們只有一個大腦。
回答完畢。

反覆看了這兩張圖總結
1、當我們看成老婦的時候，眼睛的焦點在老婦的眼睛（美女的耳屎）
2、看成美女的時候，眼睛的焦點在美女的眼睛（老婦的鼻毛）
想了想，這也是人們觀察的方式，即雙眼的焦點擴散開。
要是某人雙眼的焦點不在一起，那麼不是藝術家就是神經病，可惜的是，很多時候這兩者是沒有區別的（誤）。

我一次可以看到兩個

對我個人而言,很難看出老婦是因為老婦是個西方人的形象,另外頭髮也是一個原因.
而少女由於是側臉十分容易辨別.

因為看老婦時，少女被識別為鼻子，除非你能接受她的鼻子長了一張人臉。

同理，你識別少女時，老婦的臉被識別為脖子。

根源是視覺元素的分組，重心及加工的方式。
還有就是圖像是二維的，但大腦會自動加上厚度，以及所推測的背面。，形成完整的三維。而這個自動生成的三維圖是固定的。很顯然兩種方式腦補的厚度及背面數據不同。

比喻的話，雞蛋，西紅柿，醬油，只能被處理為雞蛋羹和西紅柿炒雞蛋，因為雞蛋不能同時既被炒也被煮，而炒和煮是腦補的過程

因為你的顯卡是單核的

緩存.

正常人的人格只有一種，意識同樣是一種，觀察結果只能說是一個意識形態下的一個對某種現象的映射，從現象(觀察)到意識，這樣的映射，所以只有一種。

我覺得可以簡單的這麼理解七巧板的總面積是固定的你想拼成一種圖案需要花費七巧板的全部板塊那麼你就不可能同時拼出需要花費相同多板塊的另一個完全不同的圖案圖中老婦人的鼻子也可以是少女的臉你選擇拼老婦人就不可能再把老婦人的鼻子給少女作臉

其實我怎麼看都只看到了一個少女。。。

能啊，我看到是兩個人物