人的平均邏輯遞歸層數是多少?

如最簡單的剪刀石頭布遊戲:如果他可能出石頭,我就應該出布;

但如果他知道我出布,他就會出剪刀,我就應該出石頭;

但如果他又知道我出石頭,他就會出布,我就應該出剪刀……

如此無限循環。

這很顯然是一個遞歸過程,做出正確決策的關鍵在於判斷對方的邏輯層數。所以,人的平均邏輯遞歸層數是多少?


如果有紙筆的話,用適當的方法表達思路,應當可以有很多層


-

這問題本是個非常不錯的研究角度,只是提問者沒有對問題進行清晰的闡述。首次在知乎上嘗試用本專業知識解答,不正確的地方請專業人士斧正。

所謂的邏輯遞歸層數,我理解是在假設A成立的情況下推出B,在B成立的情況可以推導出C……直到推導出正確的最優解為止的推導次數。如果我對這個概念沒有理解錯誤,這麼修改問題描述些許直觀一些:圍棋或象棋中一般平均能算出對手多少步棋?

在我看來,邏輯遞歸層數的概念具有局限性:

  • 存在最終解,且最終解是不循環的均衡的唯一解或唯一解集合。原問題描述中的解集就是無限循環結集,因此最優解集合也是無限循環的,不存在層數的概念。

  • 邏輯模型的推導步驟比「人的平均邏輯遞歸層數」長,A先說一個數字(0&<=x&<=3),B說的數字為A數字的兩倍,A又是B的兩倍……如此往複,誰說到最後一個小於某個數字(比如y&<20)數字誰獲勝。這樣A也許只要嘗試遞歸幾次就能得到最優解,如果(0&<=x&<=13),(y&<3000)興許就不是那麼容易了。

  • 最優解的博弈參與人數是多少?圍棋是2人,橋牌是4人。

  • 博弈過程是輪流制還是同時制?一人一步還是同時開始,比如接力賽跑?

  • 博弈過程是否具有時效性?圍棋也分快棋賽和不計時賽制,每個棋手的平均博弈時間和博弈次數均會產生很大的不同。
  • --------------對本問題關鍵的補充------------------
  • 邏輯是否存在概率問題,比如首次出剪刀概率為80%等等,這是隨機博弈的範疇
  • 基於隨機博弈,選擇的維度一樣否?石頭剪子布的維度是3選1,圍棋下一步的位置的維度和自己段位和對手的段位有反比關係(顯然,段位越高,對最優決策判斷失誤的可能性越小,而落子的維度自然減小)

因此,比起邏輯論,問題本身的「平均」賦予問題心理學和行為學的色彩,不同生活習慣,不同行業,不同智力得到的結果往往相差很大甚至是不同的級數,一般意義上,不算棋手,單說從事管理科學決策,戰略分析,用戶心裡研究和演算法邏輯程序員等職位的專業人士肯定會高與普通人,先細分領域再求平均數才能使這個問題的研究具備實際價值。

----------?----------

假設我對問題理解是大致正確的,那麼假設原問題描述中,參與人數 &>=2,存在且唯一存在一個最優解(或最優解集)。則問題可以歸納並建模為:多人博弈中,以求出納什均衡解為目的,決策過程的所用到的決策分析層次模型的次數問題及其影響因子。

此處僅介紹最基本的解決思路:

魯賓斯坦(Rubinstein)模型,也稱為討價還價模型,企業一般採用此模型進行併購價格的談判活動。

在這個模型里,兩個參與人分割一塊蛋糕,參與人1先出價,參與人2可以選擇接受或拒絕。如果參與人2接受,則博弈結束,蛋糕按參與人的方案分配;如果參與人2拒絕,他將還價,參與人1可以接受或拒絕;如果參與人1接受,博弈結束,蛋糕按參與人2的方案分配;如果參與人1拒絕,他再出價;如此一直下去,直到一個參與人的出價被另一個參與人接受為止。因此,這屬於一個無限期完美信息博弈,參與人1在時期1,3,5,?出價,參與人2在時期2,4,6,?出價。

有可能影響博弈次數的情況有:

  • 貼現因子

貼現因子在數值上可以理解為貼現率,就是1個份額經過一段時間後所等同的現在份額。這個貼現因子不同於金融學或者財務學的貼現率之處在於,它是由參與人的「耐心」程度所決定的。「耐心」實質上是講參與人的心理和經濟承受能力,不同的參與人在談判中的心理承受能力可能各不相同,心理承受能力強的可能最終會獲得更多的便宜;同樣,如果有比其他參與

人更強的經濟承受能力,也會佔得更多的便宜。

  • 「先動優勢」與「後動優勢」

在討價還價的談判中,先出價的一方和後出價的一方有著各自的優勢,即所謂的「先動優勢」和「後動優勢,這兩種優勢的發揮取決於前面提到的耐心優勢。「先動優勢」通過模型可清楚地看出來,為方便起見,假定δ1=δ2,當X=1/1+δ)&>0.5。即參與人1的份額總是大於參與人2的份額,始終處於有利的位置,也就是說,在雙方都沒有足夠耐心的情況下,先出價的總是處於有利位置。然而,在雙方都有足夠耐心的情況下,即當δ1=δ2=δ=1時,後出價的一方佔據了有利位置。這是因為,參與人最後出價時,他將拒絕任何自己不能得到整個份額的出價,一直等到博弈的最後階段得到整個份額為止。這種「後動優勢」只是在理論上有意義,因為現實中的參與人都不可能有足夠的耐心。

  • 「儘快接受」原則

由於貼現因子的作用,參與人在本期所得的份額X和下期所得同樣份額的X在價值上是不相等的,下期的x經過貼現只能等於本期的δX,要小於本期的X。因此,參與人均應儘快接受對方合理的報價,否則,即使在下期談判中獲得相同甚至更多的份額也町能小於本期的份額。

納什均衡(Nash equilibrium),又稱為非合作博弈均衡

在動態博弈中,納什均衡的要義在於:即使在對抗條件下,雙方可以通過向對方提出威脅和要求,找到雙方能夠接受的解決方案而不至於因為各自追求自我利益而無法達到妥協,甚至兩敗俱傷。穩定的均衡點建立在找到各自的「佔優策略」(dominant strategy),即無論對方作何選擇,這一策略始終應優於其它策略。

圍棋則是對弈雙方相繼按照一先一後次序行動的博弈。對於一人一步的相繼行動的博弈,每個參與者都必須向前展望或預期,估計對手的意圖,從而倒後推理,決定自己這一步應該怎麼走。這是一條線性的推理鏈:「假如我這麼做,他就會那麼做———若是那樣,我會這麼反擊」,後面的步驟依此類推。也就是說,你怎麼走棋,完全取決於對手的上一招。這在博弈論上叫做「倒推法」。

求納什均衡解中的影響因素有:

  • 馬太效應

也就是說凡是擁有較少的,連他僅有的那一點點也奪過來;凡是多的,就加給他,讓他更多。比如在圍棋上,就有「一招不慎,滿盤皆輸」的諺語,當然我們也要應用馬太效應原理,在獲得優勢的情況能夠保持優勢,擴大優勢,直至最後成功。

  • 對手策略規律的把握

而在同時行動的靜態博弈里,沒有一個博弈者可以在自己行動之前得知另一個博弈者的整個計劃。在這種情況下,互動推理不是通過觀察對方的策略進行,而是必須通過看穿對手的策略才能展開。

要想做到這一點,單單假設自己處於對手的位置會怎麼做還不夠。即便你那樣做了,你只會發現,你的對手也在做同樣的事情,即他也在假設自己處於你的位置會怎麼做。

因此,每一個人不得不同時擔任兩個角色,一個是自己,一個是對手,從而找出雙方的最佳行動方式。與一條線性的推理鏈不同,這是一個循環,即「假如我認為對方認為我認為……」。

這樣來看,定式是一系列納什均衡的累計直至局部達到穩定的一種變化,直到一方認為可以根據形勢選擇任何變化或脫先而無局部受損之虞。由於定式是在大量實戰基礎上不斷被驗證並長期積累而成。

參考文獻:

http://www.hudong.com/wiki/%E8%AE%A8%E4%BB%B7%E8%BF%98%E4%BB%B7%E6%A8%A1%E5%9E%8B

http://baike.baidu.com/view/28460.htm

http://boyilun.net/gametheory/analysis/2006-12-24/79.html

----------?----------

關於邏輯層數的問題,可以參考我在「諸葛亮邏輯有幾層?」中的回答:

http://www.zhihu.com/question/20451699/answer/15286807


謝邀。我就不客氣地吐槽了:題目沒邏輯,且與邏輯無關。

如最簡單的剪刀石頭布遊戲:如果他可能出石頭,我就應該出布;

如果只是 「可能」,那麼邏輯上推不出 「應該」。

但如果他知道我出布,他就會出剪刀,我就應該出石頭;

不,他不知道,是你假設的。這個假設是錯的,所以結論是錯的。

但如果他又知道我出石頭,他就會出布,我就應該出剪刀……

不,他不知道,是你假設的。這個假設是錯的,所以結論是錯的。

如此無限循環。

自擾……

這很顯然是一個遞歸過程,

遞歸的每一步假設是錯的

做出正確決策的關鍵在於判斷對方的邏輯層數。

這類隨機博弈不存在所謂正確決策 http://en.wikipedia.org/wiki/Stochastic_game

所以,人的平均邏輯遞歸層數是多少?

你說呢?


人還是動物,不是這樣理性的

剪刀石頭布會趨向出上一回合能打敗對手的手勢

對方情感上喜歡哪個決策就會趨於做出那個決策

所以每個問題得具體分析(^o^)/


推薦閱讀:

MD5是滿射嗎?
德國計算機專業對數學要求高嗎?
非計算機專業的學生怎麼系統的自學計算機的課程?
伯克利的Summer School選CS61A和CS61B怎麼樣?

TAG:思維 | 計算機 | 邏輯 | 邏輯思維 | 博弈論 | 計算機科學 |