人工智慧社會學－未來的新興學科？——AI視野（四）

04-29

本文為「AI視野」這一系列的文字的第四篇

前三篇：

張江：揪著自己的頭髮離開地球——AI視野（一）

張江：透視深度學習，暢想未來應用——AI視野（二）

張江：從萬物有靈到AI掌管世界——AI視野（三）

導語

從個體層面來說，你並不比孔子那個時候的人聰明多少，然而現代人類整體的能力卻是古人所無法企及的。是文明與科技——這個人類集體的創造物反過來賦予了每個人類個體更高的智能。同樣的道理，個體層面的人工智慧存在著能力上的天花板，只有將成千上萬的AI鏈接、整合起來，甚至創造出AI自己的文明，才可能為每一個個體AI賦能。

還記得這張圖嗎？在上一篇文章中《從萬物有靈到機器掌管世界》，我們將整個世界按照人類是否能夠理解的程度劃分了三個區域，現在我們將進入「人工智慧自己玩」這個區域……

聊天機器人、推薦演算法、智能助理，我們已經被越來越多的人工智慧所包圍。就像我們現在越來越多地依賴微信一樣，未來的AI程序將會形成每個人的數字化外衣，我們需要透過這層外衣才能間接地與外在世界互動。智能程序可以在一定程度上進行自主思考，所以，它們之間會形成一個龐雜的社會。放眼未來，我認為這種大趨勢必然會催生一門新興學科的誕生——我把它叫做「人工智慧社會學」（Socialogy of Artificial Intelligence），它將會在未來世界起到越來越大的作用。

1 人工智慧的社會

實際上將Social（或者Socialogy，Society）與人工智慧（Artificial intelligence，或者Agent等）辭彙相結合的學科已有不少。在20世紀90年代的時候，複雜性科學興起，人們忙於利用計算機建模與模擬的方式來模擬各種複雜系統。社會系統顯然是這類模擬程序所關注的一個主要對象。

最近的AI研究又呈現出了一種新的趨勢，就是將深度學習研究與群體智能（collective intelligence）相結合。儘管由於算力的限制，目前所考慮的智能體數量一般都很少，但是可以預期在不久的將來，運用深度學習技術構建的集體智能框架將會出現。

隨著演算法經濟的興起，現實世界中的智能程序開始彼此相連，於是為這些智能體制定交易規則成為了一種新的問題。人們發現，本已備受詬病的主流經濟學（Mainstream）也許更適合描述智能體，而非人類。這是因為，智能體可以更符合「理性行為人」的基本假說。

所有這些本質上都是在研究人工智慧構成的社會，儘管它們的本質目的並不是相同的。接下來，就讓我們沿著歷史的順序，考察人工智慧社會的研究思路。

人工社會

早在1971年，著名的經濟諾貝爾獎獲得者Thomas Schelling就構造了一個人工智慧社會Segaration，用來研究種族隔離問題。紐約一直是一個多民族聚居的城市，Schelling敏銳地發現，同種族的人會相互聚集在一起。儘管後來紐約政府曾試圖強制將不同種族的人混合在一起，以促進民族和諧，但是經過長時間的演化，家族的不斷搬遷，最終仍然形成了多種族分割的現象。為了理解這一社會現象，Schelling開發了一個簡單的人工社會模型Segaration，該模型不僅重現了種族分割現象，還從模型的角度證明了政府強行將不同種族混合在一起的嘗試是徒勞的。更重要的是，Segaration成為了社會學模擬的開山之作，後來Schelling還榮獲了諾貝爾經濟學獎。

Netlogo中的人工社會模擬程序Segaration，其中紅色和綠色格點分別表示兩種不同的種族居住地，黑色格點表示空地。每個紅（綠）格點都按照如下規則演化：當鄰居中異族比例超過一定閾值（參數p）的時候，就搬家，隨機找一個沒有人的地方住下來。最終，模型有可能演化到一種穩定的形態。如上圖所示，不同種族分別住在了不同的區塊。

密西根大學的著名政治學家R. Axelrod也是研究人工智慧體社會學的先驅，他早在1984年的時候就組織了多輪計算機實驗以探討合作的演化。它首先採用人工參與的方式，即向全世界學者徵集人工智慧程序，並將這些程序放到同樣一個競技場內進行交互。然後，競技場會任意選擇兩個程序，並讓他們玩所謂的囚徒困境博弈，以計算兩個程序的相應得分。最後，經過多輪比賽後，得分最高者卻是一個超級簡單的程序，叫做「針鋒相對」（Tit for tat），它的策略是首先合作，然後只要對方叛變，他就果斷地不合作。

囚徒困境博弈，該博弈凸顯了合作的複雜性。儘管對於雙方整體來說，都合作是最好的選擇，但是該博弈的納什均衡解卻是都背叛。

第二場比賽則完全沒有人類來參與，而是允許程序自己通過遺傳演算法而不斷地改進程序，看最終進化是如何在這個人工社會中起作用的。研究結果表明，合作作為一種進化穩定的結果是可以自發演化出來的，而且遺傳演算法甚至可以發現比人手工編寫更好的程序。

另外一個早期的人工社會模型要算Arthur和 Holland合作的人工股市模型（Artificial Stock Model）。與傳統的股市交易模型不同，Arthur等人放棄了每個交易主體（Agent）都必須具有全部的信息、完美的理性等強假設，取而代之的是Agent可以通過歷史信息不斷的學習，修改自己對股價走勢的預測；也就是說人工股市是一個不斷變化的永不平衡的系統，Agent之間的關係是一種既有競爭又有合作的協同進化關係。該模型成功的模擬出了真實股市中的「股市心理」，以及狂漲狂跌的非線性突變現象。目前，運用人工股市模型，人們可以通過更改模型的參數來模擬、預測某種新的股票政策是否可以達到預期的效果。

1996年，Epstein和Axtell在計算機中構造了一個人工智慧農場，叫做Sugarspace，其中可以時不時地長出「糖果」（Sugar）或者「香料」（Spice）出來。之後，他們將一系列人工智慧體放到其中，並為這些Agent賦予簡單的程序，讓它們在這個開心農場中開採、交易、繁殖、社交，……。所有這些有趣的實驗結果被他們總結成了一本書，就叫做「養殖人工社會」（Growing Artificial Societies）。

「Growing Artificial Societies」一書封面

ASPEN模型是美國Sandia國家試驗室在 1996 年開始開發的一個基於Agent的經濟系統模型。這是一個較大規模的模擬了包括公司、住戶和政府等各種Agent的經濟系統模型。採用先進的建模技術以及大規模並行計算機的支持，ASPEN模型成功的應用於美國宏觀經濟系統和過渡經濟的研究中。

……之後，這種人工模擬社會的方法被應用於從經濟學、金融學，到組織學、文化學、社會學等各個方面。更多詳情請點看本人多年前寫的一篇綜述文章《人工社會——基於Agent的社會學模擬》點擊閱讀原文可以獲取。

集體智能（Collective Intelligence）

90年代可以說是多個體研究（Multi-agent system）大爆發的時代，另外一個引人矚目的研究領域就是所謂的集體智能，它是希望為每個微觀個體設計簡單的規則，從而在整體實現期望的屬性，例如求解工程中的優化問題。順便說一下，集智俱樂部一詞的來源就是集體智能。

集體智能的一個最典型例子就是螞蟻群體（Ant colony）。我們都知道每一隻螞蟻都不夠聰明，但是成千上萬隻螞蟻組成的蟻群卻具有超凡的群體智慧。例如，南美洲有一種螞蟻叫做行軍蟻，當森林火災發生的時候，它們可以聰明地聚集成一個大螞蟻球，快速滾動出火災包圍的區域。實際上，這個過程會犧牲掉大量螞蟻球外圍的螞蟻，但是為了集體的生存，它們會「聰明地」想出這個拯救辦法。

再比如，螞蟻群體不僅能夠找到從巢穴到食物的通路，還能夠找到在所有可能通路之中最短的一條，如下圖所示：

隨著時間推移（從左往右），螞蟻最終會收斂到若干路徑中最短的一條上面去。通過計算機模擬人們知道，只要讓螞蟻可以釋放信息素（一種氣味），這種信息素又能吸引更多的螞蟻聚集過來，那麼這群螞蟻智能體就能找到最短路。

一旦理解了其工作原理，人們便可以借鑒螞蟻的智慧，通過模擬螞蟻與信息素交互的規則，可以將蟻群的智慧應用於工程實踐之中，例如下面兩張圖就展示了用蟻群演算法解決路徑導航問題，和推銷員旅行問題。

運用蟻群演算法最終找到了地圖上的最優導航路徑

運用蟻群演算法解決TSP問題（Travel Salesman Problem，旅行推銷員問題，即要求一個推銷員要走遍所有城市，不能重複，並且還要回到起點，同時要求整個路徑要最短。）

借鑒大自然中的群體智慧，人們開發了不少集體智能演算法，這些演算法只要讓每一個簡單個體遵循非常簡單的計算規則，就可以智能地解決一系列複雜的難題。從某種意義上說，神經網路其實就是利用了群體智能，因為每個簡單的神經元都遵循簡單的規則來完成信息的發放，但是大量神經元整體卻可以產生智慧。

深度學習助力

然而，這些程序雖然展現了豐富多彩的集體現象，但因為它們受制於早期計算能力的限制，只能通過很簡單的代碼構造智能體，遠不能模擬複雜的人類思維。好在早期這些人工社會、集體智能研究者們更加關注的是簡單程序在整體社會層面所體現出來的湧現結果，因此，對單個智能體是否足夠逼真並不十分關心。

然而，隨著計算力的提升，以及深度學習技術的突飛猛進，人們已經具備了利用深度學習來建模Agent主體的能力了。當我們把每一個人工智慧社會中的簡單程序替換成具備「深度學習」能力的大型人工神經網路的時候，整張人工智慧程序的大網將會發生什麼就不是那麼一目了然了。事實上，現在的人工智慧科學家們已經開始了這樣的研究，他們研究興趣的焦點已經從單個的深度神經網路過渡到了多個神經網路，並且再讓這些神經網路本身聯網，只不過目前聯網的智能體數量並不多。

下面，我將分別介紹幾個研究思路：

GAN（Generative Adversial Network，生成對抗網路）

GAN的框架，其中生成模型（Generative Model）和判別模型（Discriminitive model）就是兩個神經網路構成的智能體

比如，Ian Goodfellow等人提出的對抗式神經網路就是一種兩體人工智慧，其中一個神經網路負責生成圖像，另一個負責辨別究竟是神經網路生成的還是真實的圖片。在這樣一種框架下，我們可以同時訓練兩個網路，結果卻比僅僅訓練一個生成網路得到了好得多的效果。這也許恰恰就是蘊含在集體之中的神秘力量。

我們還可以將這種二體的競爭模式擴大，創造更多更複雜的玩法。比如Jun-Yan Zhu等人就將二體擴充到了4體，分別有兩個生成器和兩個判別器，並且讓它們按照如下的方式鏈接起來：

這裡藍色的框是生成器，粉色的圓圈框是判別器。整個系統可以自動生成圖片。例如如果我們將一張馬的圖像輸入進來，它就可以吐出一張圖像，把馬變成了斑馬。它是怎麼做到的呢？首先，生成器G會根據圖片X生成圖片Y，DY保證了這個Y要足夠真實。然後再把這個Y輸入給生成器F轉化為圖片X，還要要求這個X要和X足夠靠近。類似的，如果從任意圖像Y經由生成器F轉化為圖像X，再從G轉化為Y，在整個的過程中，要求：1、經過DY判斷，Y要足夠逼真；2、X與X『要足夠相似；3、經由DX判斷，F生成的X要足夠逼真；3、Y與Y『要足夠靠近。這就可以使得網路學習到了X域（所有包含白馬的圖像）到Y域（所有斑馬圖像）的對應。

這樣，我們只要輸入給這四個Agent兩組圖片，比如一組圖片全部是馬，另一組圖片全部是斑馬，經過訓練，就可以將一組圖像映射為另一組圖像，例如將馬變成斑馬、將包包上色、以及將塞尚的風格遷移到我的照片中來。

還有更複雜的玩法，Taeksoo Kim等人將相互連接關係製作了一個五花大綁，結果網路不僅可以生成類似於真實的圖像，也能夠讓輸入輸出圖像形成對應。

Cross Domain GAN架構示意圖，其中包括四個生成器和兩個判別器

多體的引入讓GAN系列的研究如火如荼，然而生成器和辨別器的關係就像是警察和騙子，生成器是造假者，辨別器是抓造假者的警察，它們構成了一種相互對抗的競爭關係。

然而，多體關係不僅僅包括對抗性競爭關係，更多的則是合作、協調、配合的關係。這方面的研究最近也是越來越多了起來。

交流與合作

前不久，Facebook爆料，他們的人工智慧程序們在交流的過程中發明了特屬於人工智慧的語言，如下所示：

這是什麼？難道是人工智慧也會「鬼搐」了嗎？

實際上，這就是LSTM神經網路在未訓練好的時候經常會表現出來的行為，似乎FB在搞笑。但是，Facebook的科學家們的確在研究多個AI程序如何在特定的條件下產生語言。他們將一群Agent放置到了一個模擬的環境中，並賦予它們相互交流的能力：它們可以通過發送一些在人類看來無意義的信號而彼此通訊。

這個研究通過在機器中營造了一個模擬的環境，讓多個Agent完成相互作用，從而演化出自己的語言。每個Agent都需要到達目標節點（landmark），並讓它的夥伴也達到規定的地點。在這種情況下，Agent可以通過發出一系列的抽象信號（Utterance）來相互協調。之後研究人員對這些信號進行了一定的解讀，並發現它們可以形成有體系的符號及其意義。

在另一個實驗中，研究人員要求兩個聊天機器人可以針對圖像完成多輪對話。其中，一個機器人可以將它所看到的圖像儘可能地描述成一些符號串，把它傳遞給第二個機器人；而第二個機器人無法看到圖像，但卻可以根據第一個機器人的描述儘可能猜測圖像之中的內容。最終，當第二個機器人能夠猜出原圖內容的時候，它們獲得了遊戲的勝利。在這個過程中，機器們可以演化出自己的語言。而且，當我們用人類的對話數據來做預訓練以後，這些機器人就可以演化出人類能夠聽懂的語言，並用這種語言來對話了。實驗人員指出，這種通過兩個機器人合作的方式來生成對話比用一般的監督學習方式訓練一個機器人要更有效率得多。

另外一個斯坦福大學計算機系的HeHe等人的研究成果表明，機器人可以通過交流的方式完成合作。還是兩個機器人，它們被要求針對一個內在的知識圖譜來找到共同的朋友。於是，這些Agent可以根據自己的知識圖譜而發送出語言，來傳遞給它的合作者，而合作者則將根據收到的消息而嘗試理解，並根據獲得的信息進一步提問，最終當兩個機器人找到了它們朋友列表中的一個共同朋友後就會完成遊戲。在整個過程中，機器不僅能夠找到最終的朋友，而且還能在訓練期間得到一個非常完善的知識圖譜以及圖譜的抽象表示。

類似這樣的研究還有很多。現在的AI研究者已經重新將焦點從單個主體移到了多個主體研究工作中；另外，利用深度學習方法對每一個人工智慧主體進行建模可以豐富每個主體的表現，還能夠更加逼真地模擬人類行為。大量的研究表明，對於同樣的問題，例如多輪會話，多個主體會比單個主體更好地完成任務。

機器經濟學

儘管目前的多主體研究隨著深度學習的滲透已經湧現出了一些有趣的新結果，但這與現實情況還有很大的差距。設想一下，如果未來聯入互聯網的五百億設備都裝備上深度學習模塊，那麼我們應該考慮的人工智慧社會就不再是簡單的兩三個智能的合作與交流，而應該是五百億個（注意，這已經遠遠超出了現在的地球人口）人工智慧主體所構建的超大規模的機器社會。於是，這一全新的社會將會給我們帶來怎樣的挑戰？我們還能對它實施管理嗎？

比較樂觀的一點是，現在的機器還沒有完全脫離我們人類的控制。那麼，我們需要搶在機器擁有自由意識之前為他們制定好規則。

其實，科學家們早已經展開了行動，他們用「機器經濟學」（Machine Economics）來概括這一新興研究領域。我們知道隨著全球性的金融危機爆發，傳統主流經濟學（Mainstream economics）受到了大量的詬病。人們指責，由於主流經濟學中關於「理性經濟人」的假設過於嚴格，從而使得經濟學的研究嚴重脫離了人類行為的實際表現。

但是，隨著人工智慧的興起，人們突然發現，主流經濟學中的「理性經濟人」假說更適合描述人工智慧，而非不理性的人類。顯然，人工智慧程序這種「機器經濟人」（Machine economicus）會比人類更可能嚴格按照「理性經濟人」假設的情況來完成決策和行動。事實上，隨著近年來計算經濟學、計算博弈論等學科的進一步發展和計算能力的大幅度提升，人們已經可以在機器中利用演算法的方式逼近所謂的「理性經濟人」模型。於是，從這樣的基本點出發，我們便能構建所謂的「機器經濟學」這一新興科學。

機器經濟學將會面臨一系列的問題。假設程序A代表了主人a的想法，而智能程序B代表了主人b的想法，那麼當A代替主人向b購買產品的時候，A將會與b的代理B進行演算法的討價還價。由於A和B都是近似的理性經濟人，這些演算法就會盡其所能充分暴露自己的偏好，并力圖達成一個對主人最好的結果。這樣，在人類經濟系統中的信息不對稱的問題就有可能不復存在了。

當然，這裡面的關鍵就在於我們應該如何為機器演算法們設定環境和一系列的交易的基本規則，學名叫做機制設計（Mechanism design），以使得近似理性的演算法能夠在給定的機制下實現一定程度上的最優。

比如說，在囚徒困境博弈之中，我們可以通過引入「協調者」從而讓兩個近似理性的Agent能夠達成合作，博弈矩陣如下：

博弈的支付矩陣，每一個矩陣元給出了（行玩家、列玩家）的效用。（A）囚徒困境。戰友策略均衡是（背叛，背叛）。（B）協調的囚徒困境。佔優策略均衡是（協調者，協調者）

再比如，Google的競價排名就是一種典型的將機制設計理論應用到演算法設計上的一個成功案例。根據經濟學中的拍賣理論，第二價格拍賣（Second price auction）會比第一價格拍賣更好地揭露交易者的隱藏信息。

近年來，搜索引擎競價已經開始支持更豐富的，基於目標的出價語言。例如，廣告客戶可能要求在受預算約束的情況下對一組加權的查詢主題來最大化點擊。搜索引擎可以提供代理主體，來代表廣告客戶出價以實現所述目標。代理主體的的引入以及早期從一級價格拍賣到二級價格拍賣的轉換本質上就是信息揭示原理的計算應用，這是機制設計理論中的一個基本概念。簡單地說，如果一個機制的規則和該機制的均衡策略被一個在功能上等同的新機製取代，那麼這個新機制將是激勵相容的。雖然在形式上說重新設計沒有專門地考慮激勵相容性，但二級價格拍賣和投標代理都可以看作為早期版本中的廣告主的行為。另外，廣告平台還可以設計一種策略防範（strategy proof）機制[Vickrey-Clarke-Groves機制]來決定廣告空間分配：哪些廣告被分配，哪些（非贊助的）內容陳列給用戶。

兩代贊助搜索機制。早期的設計是一級價格拍賣（FP），廣告商（ADV）使用AI（AI-POS）以最低的可能價格在搜索結果列表上保持位置。引入二級價格（SP）拍賣機制，旨在取代FP和AI-POS的組合。廣告商採用了新的AI（AI-GOAL），以實現更高級的目標，例如最大化利潤或最大化點擊次數。二級價格拍賣被擴展到包括智能代理（SP +Proxy）中，旨在取代組合 SP和AI-GOAL。

在不遠的將來，假如每一個人都有自己的一個人工智慧個人助理，那麼大量的經濟交易活動就會由這些人工智慧演算法代理我們進行。於是，AI與AI之間就會討價還價。按照「完美理性」的「經濟人」假說，這些AI將能夠和諧共處，並給主人帶來最大的利益。

2 人工智慧社會學還有多遠？

《三體》中構思了一種「宇宙社會學」用來描述在時空跨度超級巨大的宇宙空間中，不同物種之間的相互作用法則。根據兩條「宇宙社會學」基本公理，1、生存是文明的第一需要；2、文明爆炸和擴張，但宇宙中的物質總量保持不變，由此劉慈欣推導出了技術爆炸和猜疑鏈這兩個基本概念，以及「黑暗森林」這個宇宙尺度的叢林法則。

於此相似，如果人工智慧社會是可能的，那麼是否存在著人工智慧社會學這門學問呢？它將會是什麼樣的呢？我們能否像宇宙社會學那樣提煉出來一系列的公理用以構架一個理論體系？

也許正如機器經濟學所描述的那樣，相對於構建人類自身的社會學原理來說，人工智慧的社會學會更加簡單。原因在於機器完全有可能按照一種人為預設的方式來進行行為，這樣的話機器會更加接近於理性人假說。或者，反過來說，人工智慧社會學的基本原則與其說是一套公理體系用以描述AI，還不如說它是一套未來AI的行為準則。與物理學研究範式最大的不同就在於人工智慧，以及人工智慧社會究其本質是一種規範性研究（Normaltive）。如果這個結論是正確的，那麼構建人工智慧社會學也許真的是可能的。

另外一個問題是，這樣的理論體系有什麼用呢？

也許它可以幫助我們人類更好地理解海量的人工智慧所構成的巨系統，也許它可以讓人工智慧的群體更好地運轉。然而，還有一種情況是，也許人工智慧社會學壓根就不是人類可以掌握的學問，而是一個徹頭徹尾的AI自身的學問。它們也許會比我們人類更理解AI構成的社會。有關AI社會學，也許壓根就輪不到人類來說話。

參考資料

有關人工社會，大家可以參看本人寫的一篇綜述，點擊閱讀原文獲取。
有關集體智能，請參看公眾號文章：湧現智能
有關不同架構的GAN，可以參看這兩篇文章：
Jun-Yan Zhu et al. Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks,https://arxiv.org/pdf/1703.10593.pdf
Taeksoo Kim et al. Learning to Discover Cross-Domain Relations with Generative Adversarial Networks, https://arxiv.org/abs/1703.05192
關於多主體交流與合作的論文：
Igor Mordatch, Pieter Abbeel: Emergence of Grounded Compositional Language in Multi-Agent Populations, https://arxiv.org/abs/1703.04908
Jon Gauthier, Igor Mordatch: A Paradigm for Situated and Goal-Driven Language Learning,https://arxiv.org/abs/1610.03585
HeHe et al.: Learning Symmetric Collaborative Dialogue Agents with Dynamic Knowledge Graph Embeddings, https://arxiv.org/abs/1704.07130
關於機器經濟學，可以參看：經濟推理與人工智慧