許成鋼再批「馬雲計劃經濟言論」:大數據人工智慧不能代替市場(說的真好)
第二屆野三坡中國經濟論壇演講全文:
我今天討論的是大數據、人工智慧以及計劃經濟、市場經濟的爭論。
重要的問題就是人工智慧的產生是從計劃來還是從別的地方來?這是第一個問題。第二個問題就是,人工智慧發展了之後會把我們帶到哪兒去?人工智慧會把我們帶到計劃經濟去嗎?這個就是我要今天討論的主題。
為了討論這個主題,我想從最基本的技術層面開始討論,因為我需要理解人工智慧是什麼意思,人工智慧到底能做什麼不能做什麼,大數據跟它是什麼關係。
首先,大數據它自己其實沒有那麼大的重要性,它的重要性在於它是人工智慧的基礎。如今之所以世界上所有發達國家都高度關注人工智慧的發展,原因現在已經很清楚,就是這是一次正在興起的產業革命。
這個產業革命會引起的後果立即能看到的就是大量的無人工廠會產生、許多無人服務行業會產生、人類歷史上從來沒有見過的高效率會產生,會有巨大量的失業。
那麼由於人工智慧的技術基礎是大數據,因此如今大數據變成了一個基礎資源,和我們人類歷史上過去經歷過的原材料、能源等一樣。但是這個資源不一樣的地方是它不是原來就在世界上存在的,而是我們人工去收集的。
下面的問題就是當這種生產模式發生基本變化的時候,這種全新、全面的自動化,它會不會從基本的地方改變制度?我想非常簡要的概要一下,我們要吸取從過去已經發生過的產業革命的教訓,如果我們不吸取過去的教訓,那麼我們會重蹈覆轍。
過去的產業革命之所以帶來教訓,就是因為當這些產業革命產生的時候,人們過高的估計了產業革命可能到什麼地方,在過高估計自己力量的時候人類會濫用這些新興的科學和技術。我舉兩個歷史上的例子,第一個是在第二次產生革命時期,靠那個技術在那個背景下產生出來的以國有製為基礎的中央計劃這樣一類制度的設計,這是一個過高地估計了人的計劃能力、人的統治能力設計出來的東西。
另外一個例子就是對環境的破壞,比如化石原料,化石原料的大規模使用就是伴隨著第一次和第二次產業革命來的,造成了全球碳排放過高帶來全球變暖、帶來的一系列污染,人們已經意識到現在到時間扭轉了。
這都是過去帶來的教訓,今天當大數據和人工智慧結合在一起的時候,它可能的危險我們還不知道,比如帶有壟斷性質的大公司利用手中的數據試圖來控制社會,用於大規模的戰爭,用於犯罪等等。
下面我們從最基礎的地方認識一下人工智慧和大數據,只有知道基礎,才有可能能知道它能做什麼不能做什麼。
今天人工智慧整個的大發展實際上是過去超過了半個世紀的發展積累出來的。首先,人工智慧第一個重要的部分是演算法,而這個演算法是早在1950年代就開始探索的東西。關於人工智慧的提法、演算法和想法,甚至一些指導性的意見,是很少幾個創始人在1956年的時候在一次會上把這個名字確定下來,討論了大的方向,其中奠基人之一是經濟學家西蒙教授,他是諾貝爾經濟學獎獲得者,同時他是卡內基梅倫大學的經濟學教授、計算機教授、心理學教授,這三個專業統一在一起,才有了人工智慧的想法。
人工智慧的演算法部分如今發展的最好的是所謂的「神經元模型」,神經元模型導致這個機器可以在人的指導下進行學習,所謂「深度學習」就是今天通常人們講人工智慧時所提到的東西。人工智慧的另外一個普遍使用和可探索的方法是「統計演算法」,但是無論是使用的是人工訓練的辦法還是統計得辦法,都必須要大量的數據,這就是為什麼大數據是基礎。
人工智慧的第二個基礎是計算能力。在過去的半個世紀里,計算速度、計算能力和存儲能力基本上是每兩年提高一倍(摩爾定律),積累了半個世紀以後,現在超強的能力使得無論使用任何一種計算方法的人工智慧,在一些領域機器超過人,而且是大大得超過人,一部分是因為演算法,一部分原因是因為計算能力。當然了,所有的這些的基礎是大數據。
下面我們需要理解一下大數據本身的技術基礎是怎麼回事,我們才能明白人工智慧可以做什麼不可以做什麼。首先,大數據產生的最基本的基礎是感測器、移動設備,是感測器和移動設備先檢測到一些具體的數據,然後通過互聯網和物聯網把他們傳送,然後集中起來,所謂的大數據的核心就在於收集、傳輸、儲存和處理所有這些感測器和移動設備他們可以度量的數據。這是關鍵所在,人工智慧可以做什麼不可以做什麼,是由這個決定的,即是不是可以度量。
另一層面的大數據,是利用歷史上積累的大量文獻,其中包括各個學科積累的文獻,比如說圖書館裡有文字的、有圖的、有音樂的、有舞蹈的記錄,這些全都可以轉換為大數據供機器去學習、分析。
所謂「深度學習」的人工智慧(我們今天講人工智慧多半講的是這個),它的技術基礎基本是用大數據來訓練機器來產生識別的能力、推理的能力、規劃的能力,等等。
下面我們講的是演算法,因為所謂的深度學習其實是一種演算法。這個東西從一開始產生就從同經濟學裡的決策理論是在一起的,或者換句話說可以認為它是決策理論的一個部分。演算法的核心是什麼東西?首先,作為人工智慧的設計者,你要為你的機器人分配一個目的,就是你造的這個機器在世界上的目的是什麼,它是用來幹什麼的?他的目的和我們經濟學家討論的是一回事——它要尋求它自己效益(利益)的最大化。
沒有任何一個經濟學家知道世界上每一個人真實的目的是什麼,是什麼東西影響你?抽象來說你的目的是為了幸福、為了愉快,但是什麼東西影響了你的幸福、你的愉快,沒有任何一個經濟學知道,這就是為什麼「市場」重要。下面的問題就是如果有了大數據,有了這麼聰明的人工智慧,有沒有可能通過收集無數的巨大量大數據把它算出來、把它模擬出來,有沒有可能?
下面我們就要把人的智能和人造的智能,分別看一下。首先,人的智能是產生於人的生理、心裡的感知以及人收集的信息。1950年代,西蒙教授討論人工智慧的時候,就已經區分出來了「識別」的概念,這也是今天人工智慧核心的概念。早在那個時代就已經有了所謂
冷識別和熱識別區別的辯論。什麼是冷識別和熱識別?冷識別是機器能夠識別的,熱識別是人帶著感情的識別,人帶著感情的識別機器是學不來的,這是一點。
再一點就是今天討論人工智慧也好、討論相關的激勵機制問題也好,有一個重要基本概念——硬數據和軟數據,硬數據就是前面我提到過的,所有可以度量可以傳遞的數據;但是,永遠和硬數據對應的還有一部分是軟數據,軟數據是沒有辦法用感測器或移動設備度量的,不能度量就無法傳遞、無法處理。所以當我們討論人工智慧是基於大數據訓練出來的時候,熱識別和軟數據的問題從技術上決定都不包含其中,它連基礎都沒有上哪去學呢,這就是為什麼機器不是人。
再有一點,人的智能裡邊有個非常重要的基本部分就是直覺。什麼是直覺?直覺是基於人對於硬數據和軟數據、冷識別和熱識別綜合在一起產生出來的人的一種高度的抽象的跳躍性的反映。這種直覺,不但它依賴的數據是不可度量、不可傳遞、無法機器處理的,而且產生的直覺本身也是人無法描述的,這就是為什麼師傅帶徒弟不一定帶得出來,在教學的時候,好的教授之所以好,因為好的教授有更多的好的直覺,但是這個直覺傳遞不過去,你已經想出來了都傳遞不過去,更不要說你的學生會不會學出來,這個學生能不能產生直覺是老師沒有辦法,天生的。
我想講的就是,人的智能和機器的智能中間有一個鴻溝,人工智慧的基礎是可以度量、可以描述、可以傳遞的數據,滿足這幾個條件數據在我們手裡才能訓練。
如果我們去看一看,什麼東西是可以度量、傳遞,哪些東西不可以。首先,在生物科學上,有一系列基本的人的生命感知,由生物科學已經決定了這些東西是無法度量的。我這裡只舉幾個例子,如嗅覺、味覺、性慾,這些東西是無法度量的。無法度量的東西,無論你造出來的機器計算能力有多強,演算法有多麼優秀,因為它沒有感知,你造不出來一個機器人來代替品酒師品酒,因為生物科學告訴你這個東西是測不出來的,你也不能在網上傳遞嗅覺、味覺過去。
再一點,人的心理感知也是無法度量的。喜悅、厭煩、痛苦、抑鬱、思念、懷舊、貪婪、野心等等,這些心理的內容是怎麼演變的、為什麼每個人是不一樣的等等,這些東西都是機器達不到的,因為數字是沒有的。
看一下現在對機器人、人工智慧的社會訓練是怎麼做出來的。當不存在這些原始數據的時候,它實際用的是刻畫某一些軟數據的其他參數,比如說文字、觀察某個行為的錄像,然後用機器識別錄出來的各種各樣的行為,用這個來學習。今天我們看到機器人了不起,指的都是這個方法。但是這裡面有什麼問題呢?第一個問題就是片面的,第二個問題是靜態的,靜態的意思就是你看到的是過去,你可不知道將來怎麼樣。福特不做市場調查,因為當沒有汽車的時候,你無法知道消費者的反應;當沒有手機的時候,你也無法知道人們對手機的反應,沒人知道,因為人們沒有。
因此,深度學習的人工智慧它最終不涉及學習人的智能的這些原始基礎要素。原因就是因為它缺少大量人的基本感知,這樣機器沒有可能通過學習來產生和人相似的效應反射。任何一個人工智慧的機器設備或者機器人,它的第一重要、最終重要的是它自己的效應反射,即它的目的是什麼,它活在世上幹什麼,但這個東西是沒有可能讓它學來的,學不來的原因是缺少原始基礎要素,因此只能是由設定它的人分配給它。
經濟學家從來並不真知道人的真正的效應函數是什麼,我們永遠不知道,因此,人分配給機器的效應函數沒有可能是人的普遍函數,只能是在一個狹窄範圍內定義的、靜態的,即可預見的。因此從廣義上講,任何的人工智慧設備或者機器人的目標函數,不是也不可能代替真的人的自身目標。這個概念其實早在西蒙獲得諾貝爾獎的時候就提出了,即「有限的理性」,這個概念一直影響到今天,而且是經濟學發展最前沿的東西。「有限的理性」是當初討論計劃、規劃的時候認識到的,我們永遠受這個概念的限制。今天我們討論機器人,你分配給機器人一個效應函數,它一定不會比你更好。
因此,結論性的意見就是你沒有辦法訓練源於人自身的原始偏好和動物性而產生出來的目標行為。今天我們見到的可以深度學習的人工智慧,實際上只限於訓練模仿人在已知的環境里的行為。因為,你是靠已知的環境下收集的數據訓練的。例子就包括在市場中的消費行為、在自由環境里參加討論的那些人的社會行為,以及比如說面對一個知音者或一群知音者,音樂家的表演行為。你收集到的行為實際上是有限的,是限定在已有制度里的,你拿這個來訓練你的機器人,機器人會模仿在這個狀態是什麼樣,一旦脫離了訓練的環境,沒有原始動力的人工智慧實際上是沒有辦法的。
到底人工智慧能幹什麼?能幹的事非常非常多。剛才我們講的是它不能幹什麼,它能幹的事兒就是它可以規劃,也可以執行。但是它能夠規劃和能夠執行的事的前提必須是,你的目標是清楚規定的。
因此,人工智慧會有非常大的革命,它產生在所有你能想像的、能明確規定目標任務的,這些領域它就能幹。比如說下棋,下棋計算過程很複雜,但目標很簡單,就是贏了對方,但是人類碰到的事不是那麼簡單。還有開車、開飛機、開船等等,甚至根據設計製造產品,甚至成體系地設計產品,只有規定的目標就行。在全面自動化的情況下,無人的工廠內,激勵機制自然也就消失了。
另一方面,當做與人有關的工作的時候,它可以是非常好的助理,它可以是非常好的助教、助理研究院員、金融分析師、醫生助理、律師助理、軍事參謀。為什麼都是助理?因為它沒有辦法代替人。最近在美國做了個實驗,讓機器人去經濟學做助教,在不見面的前提下,一個學期過去之後,學生分不出來哪個是真人哪個是機器。但是它必須是助教不能是教授,因為有大量的重要地信息這個機器它沒有辦法知道。
因此,在最樂觀的情況下,整體來說,如果你有明確規定的狹窄的的目標來執行,機器人都會做,包括戰爭,這是一個嚴重爭議的問題。在最樂觀的情況下,人工智慧最終可以規劃和執行企業和軍事任務。
在這裡我就想回到咱們最大的主題上,我想強調一下:第一,經濟任務和軍事任務和本質任務不同,因為軍事任務的目的簡單——打勝仗,而經濟任務的目的說不清楚了,經濟任務的目的是國民福利,不是經濟增長。什麼叫國民福利?指全體國民的感覺合在一起,連我們人也搞不清,所以沒有可能使機器做。另外一個,企業治理和國民經濟本質是不同的。因為企業追求利潤,而國民經濟追求國民福利。
到底有沒有可能人工智慧來了以後,計劃經濟就能代替市場經濟呢?答案非常簡單,我剛才已經把人工智慧的基礎說清楚了,大數據從市場上來,你如果把市場消滅了,數據沒有了。你說,我現在收集了人類歷史上沒見過的無數的數據,我就可以不要市場了,就可以計划了,那你搞錯了,因為你把市場消滅以後,你的基礎也就沒有了。
還有最重要的一點,當你把市場消滅後,如果你試圖用人工智慧、大數據去解決資源配置也一定搞錯了。為什麼?尤其是在跟創新相關的資源配置問題上,這些資源配置大量工作實在市場中由風險投資專家做的,因為他們掌握大量的軟數據,他可以憑他們的直接進行判斷。人工智慧只能處理硬數據,沒有直覺所以不能產生這個判斷。
今天實際上人工智慧的人才在哪?截至今年的第一季度,全球人工智慧人才一共190萬人,其中中國5萬人,而這5萬人裡面做這行達到十年的不到40%。有85萬人在美國,而美國的85萬人里,有十年以上經驗的占其中的71.5%。原因很簡單,在市場的環境下才有這麼多的創新能力的人出來,你如果把市場的環境搞掉,創新是很難發展的。
最後我總結一下,大數據、人工智慧和制度之間有非常深刻的關係,制度會深刻影響大數據和人工智慧的發展,原因是因為大數據的收集處理會受到制度的制約,比如說哪些是合法的、是不是得到支持、或者社會上有沒有反彈,比如說掌握技術有壟斷權的壟斷權的大公司是否侵犯隱私權等。
另一面,人工智慧發展的本身,也受到制度的制約,比如說在發達經濟體裡邊,人工智慧要發展的時候,一系列行業要被淘汰,制度本身是如何面臨這個問題的。再有一點,一個社會平等或是不平等都會對人工智慧發展造成巨大的影響,原因是因為人工智慧的發展會造成巨大的不平等,一個更平等地社會會更有能力解決這個問題,而在一個不平等的社會則會引起非常尖銳的社會矛盾,阻礙人工智慧的發展。
作者:許成鋼
來源:許成鋼第二屆野三坡中國經濟論壇演講,經濟學家圈
鏈接:許成鋼再批「馬雲計劃經濟言論」:大數據人工智慧不能代替市場(說的真好)
推薦閱讀: