量子博弈的機制是什麼?

這種理論現在在學界發展如何,對未來的博弈論發展會有什麼影響?


謝邀。

我先講一下我的糗事。我在讀的上財經濟學院有個規矩,博士三年級時要做個中期宣講,類似於其他學校的開題報告吧。中期宣講沒有通過的要罰錢。正當我為此事焦頭爛額之際,我院一個做運籌學的老師知道了我本科是學物理的,就找我做量子博弈。這簡直就是一根救命稻草。我看了一個月,大致知道是怎麼回事了,就去講了。結果台下的老師都一頭霧水,不斷提問。最麻煩的是,一個做重複博弈的老師質疑這東西的經濟學意義。他說我們不是工學院,是經濟學院,經濟學用博弈論是要解釋現象的,不是說隨便在博弈論里加什麼東西都是經濟學,隨便加東西我任何結論都能推出來……不過還好我最後似乎通過了,沒有罰錢。

好了,言歸正傳。從上面可以看出,要我說量子博弈有什麼意義,我真答不上來,但是講一下量子博弈是什麼東西,我還是沒問題的。

量子博弈就是要把經典博弈量子化,就是用量子力學的方法來描述博弈。這東西當然也不是憑空來的,我感覺應該是從量子信息來的,通訊可以看做是一種博弈。量子博弈也已經不是純理論的設想,而是可以在量子計算機上實現的。但是如果你要問日常生活中有沒有量子博弈或者怎麼在日常生活中實現量子博弈,我真不知道。

之所以要對量子博弈做專門研究,是因為量子博弈往往會產生和經典博弈不一樣的結果。原因有兩條:

  1. 量子博弈的策略空間更大,經典博弈的策略空間只是一個子集。
  2. 量子博弈中狀態可以糾纏。

下面會通過兩個例子分別說明這兩點。

Meyer(1999)是量子博弈的開山之作。這篇論文講了這麼一個故事。《星際迷航》的Picard船長被迫和Q玩一個遊戲。(我從沒看過《星際迷航》,所以不認識這兩個人。)盒子里有一個硬幣,初始狀態是正面朝上,雙方都可以把手伸進盒子,選擇翻硬幣或者不翻硬幣。由於盒子是關著的,所以對方到底是翻了還是沒翻你看不見。行動順序是Q最先,然後Picard,然後Q。最後把盒子打開,如果硬幣是正面朝上,Q贏,否則Picard贏。

Picard船長學過博弈論,知道這是一個二人零和博弈,納什均衡是雙方都採取混合策略,最後雙方的取勝概率都是50%。於是他決定賭一把,結果Q贏了。他要求再玩一次,可是,不管玩多少次,他總是輸。於是Picard船長認為對方作弊了。事實是,Picard只能用經典的混合策略,而Q能用量子策略。

按照狄拉克符號,硬幣的狀態空間的兩個基是|H
angle|T
angle,分別表示正面朝上和反面朝上。行動翻硬幣用 F=egin{pmatrix}01\10end{pmatrix}表示,不翻硬幣用 N=egin{pmatrix}10\01end{pmatrix}表示。混合行動egin{pmatrix}1-pp\p1-pend{pmatrix}表示以p的概率翻硬幣。

在講Q的量子策略之前,先給沒有學過量子力學的同學介紹一下量子力學的基本知識。在經典世界裡,我們說一個硬幣要麼正面朝上要麼反面朝上,那就是只可能是這兩種狀態,如上面一段,經典行動也就只能是使硬幣在這兩個狀態之間變化。不存在說使硬幣立起來,50%正面朝上,50%反面朝上的可能性,但這在量子世界中是可能的。

量子世界中,正面朝上和反面朝上是測量時人們觀測到的本徵態,在沒有測量時,是可以處於疊加態的。在測量時,疊加態坍縮到一個本徵態,坍縮到哪個本徵態是有概率的。比如,一個疊加態在測量時有50%可能測出正面朝上,50%可能測出反面朝上,另一個疊加態測出正面朝上的可能只有30%,這就是兩個不同的疊加態。量子行動可以使硬幣在不同的疊加態中切換,比起經典行動只能在本徵態中切換,顯然行動空間大了很多。

Q的量子行動用酉矩陣 U(a,b)=egin{pmatrix}ab\ar{b} -ar{a} end{pmatrix}表示,其中ab都是複數,上面加杠表示復共軛。Q的行動把硬幣的狀態變為a|H
angle+b|T
angle,這一狀態在測量時,也就是打開盒子時,會有aar{a} 的概率正面朝上,bar{b} 的概率反面朝上,所以aar{a} +bar{b} =1

然後Picard採取混合行動,使硬幣以p的概率被翻一下,從而變為狀態b|H
angle+a|T
angle,以1-p的概率保持狀態a|H
angle+b|T
angle。注意到,如果a=b=frac{1}{sqrt{2} } ,就是50%正面朝上,50%反面朝上,那麼翻不翻都是一樣的。經典策略沒法達到這個效果。

所以,Q要想以100%的概率取勝,只要第一次用U(frac{1}{sqrt{2} },frac{1}{sqrt{2} } ),從而使硬幣處於一個對Picard的任何行動都保持不變的狀態,等Picard行動後,再用一次U(frac{1}{sqrt{2} },frac{1}{sqrt{2} } )使硬幣回到正面朝上的狀態就可以了。

從這個例子可以看出,量子博弈擴展了策略空間,量子策略優於經典策略。不過量子博弈更複雜更有趣的還是糾纏。

Eisert,Wilkens和Lewenstein (1999)把量子博弈擴展到了二人非零和博弈。他們用了個囚徒困境的例子。Alice和Bob可以選擇合作(C)或不合作(D)。支付矩陣就不寫了。學過博弈論的都知道,帕累托最優是兩人都合作,但納什均衡是兩人都不合作。下面把這個博弈量子化。

由前面的例子我們知道,量子博弈有一個初始狀態,然後再對初始狀態做操作。和前面的例子不同的是,前面的例子中只有一個粒子,就是硬幣,但這個例子中有兩個粒子,或者說兩個人,這兩個人的狀態就可以彼此糾纏在一起。每個人有兩個本徵態|C
angle|D
angle ,加起來這個系統有四個本徵態|CC
angle|CD
angle|DC
angle|CC
angle|DD
angle。假設初始狀態是|CC
angle

接下來大招來了!

我們給這個系統加上一個酉運算元J,這是一個糾纏運算元,作用是使兩個人的狀態糾纏在一起。

糾纏到底是啥意思呢?比如說一個系統的兩個粒子分別處於狀態AB,要描述整個系統的狀態是用張量積Aotimes B 。如果這個系統的狀態是張量C,而C不能分解成張量積,我們就說這兩個粒子糾纏在了一起。我查到一個定義是這麼說的:「如果一個複合物理系統的某個狀態的密度矩陣不能表示成各個子系統的密度矩陣的張量積的線性和形式,則稱這個複合系統處於糾纏態。」定義是這樣,到底怎麼理解呢?老實說,理解起來相當困難。建議大家去查一些量子力學的科普書。

我們回來,這個系統最後的狀態是J^{+} (U_{A}otimes U_{B} )J|CC
angle。其中U_{A} U_{B} 分別是Alice和Bob的策略,都是酉運算元,如果合作那就是保持C狀態不變的運算元,如上個例子中的N,如果不合作就是把狀態變為D的運算元,如上個例子中的F。中間那個符號是張量積,J^{+} J的共軛轉置。最後測量到四個可能性的概率決定期望支付。

作者指出,當糾纏達到最大時,均衡就是帕累托最優。因為糾纏而得到了和經典情形完全不一樣的結果。至於為什麼會如此的深入原因,還是請有心深入鑽研的同學自己算一下

後面的研究還有繼續擴展到多人博弈、連續策略(用的是古諾競爭的例子)等等的,但終歸不離開酉運算元策略和糾纏這兩點。

總之,這個東西確實比較玄,對於非物理專業的人來說,第一是難懂,第二是不知道有什麼用。我也是一樣,不過在這裡寫的大概都是對的。感謝大家能堅持讀到最後!

參考文獻

Eisert, Wilkens and Lewenstein (1999): "Quantum Games and Quantum Strategies," Physical Review Letters.

Meyer (1999): "Quantum Strategies," Physical Review Letters.


可能由於背景的關係, 看到博弈 (Game) 之後答主一般腦補的是演算法博弈論 (Algorithmic Game Theory) 之類的東西. 下面自說自話幾句吧. 答主也沒仔細看過相關的東西, 一是精力有限, 二是涉及的數學實在繁雜.

不過看樓上的文章, 似乎又是物理學家和計算機科學家在討論一樣的東西, 但是又在各玩各的的情形. 提到量子博弈 (Quantum Game), 我一般想到的是量子互動式證明系統 (Quantum Interactive Proof System). 但是話說回來, 即使是 QIP (Quantum Interactive Proof System) 這樣的複雜性類, 也是1999年 John Watrous 和 Alexei Kitaev 定義的, 完全刻畫它的計算能力也就是2010年的事情(QIP=PSPACE).

似乎 Thomas Vidick 的某門課 (CS286) 的 Lecture Notes 里有節相關的內容. (嘛, Simons 的 workshop 里還有個相關的 talk: A Survey on the Complexity of Entangled Provers). 不過我想這應該不是題主想看的東西, Quantum Game 是 CS community 討論非局域性(nonlocality)和 Bell 不等式的時候慣用的說辭, Gus Gutoski 和 John Watrous 在 STOC 2007 上有篇綜述性質的工作: Toword a General Theory of Quantum Games (http://arxiv.org/pdf/quant-ph/0611234). 而眾所周知, 描述非局域性的標準的數學工具是 C*-Algebra 及其表示論, 於是到這答主只能表示攤手了...

話說回來, 陳汐和鄧小鐵當年證兩個參與者納什均衡是 PPAD-Complete 的文章還是當年的 FOCS 最佳論文獎呢...(好吧答主就是最近聽了鄧老師一個 talk, 跟發現新大陸了一樣過來得瑟兩句, 畢竟計算機經濟學也是 TCS 的分支嘛


推薦閱讀:

A,B,C三人 按順序從1-100中取一個數,後取的人知道前面的人去的數,每個人取得數不能相同?
博弈論的根基是把人當做絕對理性的機器嗎?
三體中的威懾論有現實意義嗎?
每個個體的理性行為會導致所在群體的非理性行為嗎?如果會,在實際活動或經濟學中有哪些相關例子或模型?

TAG:博弈論 | 量子物理 | 量子信息 |