無論強人工智慧能否出現,人類的未來註定灰暗
本文首發於公眾號「歪理邪說」(wxieshuo)。
最近,無論中文還是英文,關於人工智慧的討論都突然變多,對於人工智慧到底會不會危害人類也成了一個熱點話題。很多討論集中在所謂強人工智慧出現之後的可能性,在這些來自未來學家的討論中,遠超人類智能的「強人工智慧」會在我們有生之年出現,到那時候人類的命運會變成什麼樣。我覺得人們想的太遠了。在強人工智慧出現之前,人類已經命運已經註定灰暗了。
今天這些討論,如果能夠穿越時間,拿回給80年代的我們同齡人看,他們反而一點也不陌生,更不會被嚇到。儘管那是一個沒有智能手機,沒有無線網路,連商用互聯網尚未成型的年代。但那個時代的人,差不多認為到2000年,一切都能實現,甚至強人工智慧也會實現。
回望80年代,即使以今天的標準看,也是一個科技爆發年代,從60年代開始的各種科學上的概念和想法,到80年代基本有了可用實現。不僅今天所用的人工智慧基礎理論和演算法在那個年代有了突破,甚至今天大家在討論的電動汽車,燃料電池………都是在那個年代就有了商用產品,今天我們說的所謂強人工智慧這個詞,也是60、70年代的產物。摩爾定律這個詞,同樣是60年代出現,80年代成熟。完全不算巧合,科幻小說在80年代也相當興盛,並且出現了以網路虛擬空間和未來為主要題材的賽博朋克流派。我一直覺得,今天這些未來學家所講的東西,沒有一樣能超過那些科幻小說的深度,尤其是賽博朋克流派科幻小說,他們所預言的近未來,幾乎已經是接近實現了。
1984年,《神經漫遊者》出版,這是一部科幻小說歷史中的里程碑式作品,它開創了以網路虛擬空間為背景的賽博朋克科幻流派,甚至定下了這個流派科幻小說的基礎元素,包括網路空間和巨型壟斷企業控制世界,當然,其中也少不了最終控制一切的人工智慧。
賽博朋克流派科幻小說中的未來大多是灰暗的,這種灰暗不是程序產生更高智能徹底奴役人類造成的,而是技術和人類本身共同完成,這也正是我的看法。
人們平時往往意識不到,如今我們早就已經生活在程序所劃定的範圍中了。這並不需要所謂強人工智慧才能做到,分布在不同系統裡面的帶有一定智能,或者毫無智能的程序,早就是人們的重要幫手。大多數情況下,人們對程序結果的信賴已經超過了對人本身。
就算是對軟體技術一無所知的人,也會從一些蛛絲馬跡中有直接感受。比如說,很多年之前,各種系統還沒有完全聯網和計算機化的時候,很多事情,只要能說服終端辦事人員,他大筆一揮,問題就解決了。但到今天,終端辦事人員往往會同情的看著你,告訴你我知道你說的有道理,但是我沒許可權改系統,所以我也沒辦法。很多時候,我們完全被系統所困住,只能想別的辦法變通執行。這些系統往往並沒有智能,它們只是強硬執行設定好的規則而已,這樣的系統照樣可以規範人們的生活。
稍微智能一點的例子,是銀行和保險行業。他們掌握著更多的數據,也可以基於數據計算出來更多的結果。無論是申請貸款還是買保險,最終給出結果的,往往並不是一個真正的人,至少不單純是由一個真正的人作出決策,而是經過一堆程序「智能」的計算。至於程序計算的結果到底對不對,是不是完全符合你的狀況,跟你打交道的真人往往也並不知道,系統是個黑箱,它做出了決策,人們遵從它。
更智能,更常見的情況是互聯網上。每一家互聯網公司以近乎貪婪的態度,去收集所有自己可能觸及的數據。用戶點擊了哪個按鈕,在哪個頁面停留時間更長,分享了什麼,贊了什麼,哪些內容被轉發,哪些內容被評論,把什麼東西加到購物車,付錢購買了什麼…所有的一切,都被記錄。新一代的互聯網公司們致力於為每一個個體提供定製的產品,你看到的頁面,和你的朋友可能完全不一樣,甚至你看到的商品價格,和你朋友看到的也未必一樣。這些都是基於你自己的行為產生的,由程序計算出來的結果,多數情況下,其中並沒有人工參與。只從體驗上看,這不是一件壞事,畢竟,按照用戶習慣定製的內容,可以讓他使用起來更舒服,節約更多時間,人們也更喜歡這樣的產品。
和幾十年前一樣,今天人們又一次開始討論強人工智慧,並且再次認為會在我們有生之年實現,除了未來學家們四處宣講,現實中的原因是以深度學習為代表的無監督學習技術開始顯出了極好的效果。通過這種技術,計算機看起來變得很智能,可以通過反饋得出一個比較好的結果。雖然這些技術讓計算機能做更多的事,但它和人類所具有的智能仍然有本質區別。
嚴格來說,深度學習並不是新技術,它的基礎仍然是神經網路演算法。還是80年代,神經網路演算法已經成熟(其實50年代就出現了),那是人工智慧投入的高發年代,大量科學家,研究生投入這一領域,可惜效果長期無法達到真正可用,最終只有少數幾個特殊場景可以成功應用。到90年代開始,這個領域失去了大多數關注和經費。最近10年,這一門派的演算法繼續演變成今天的深度學習,這一次,他們成功了。深度學習領域最重要的科學家,多倫多大學的Hinton教授帶領的團隊,在2012年LSVRC競賽上,獲得了一次巨大的成功,他們使用深度學習的演算法遠遠超過其他參賽者,大獲全勝。
為什麼一個80年代差點被放棄的方法重新回到了世界中心?因為80年代雖然可以完成理論基礎,但真正到達實用所需要的數據和計算能力都不具備。這幾十年,隨著互聯網的發展,晶元價格下降,並行計算髮展,以前的困難已經不再是問題。除了數據的數量極多,更重要的是,因為智能手機和各種感測器的普及,我們可以獲得的數據種類也遠遠多於80年代,從而可以在更多領域進行嘗試。在這些技術共同作用下,新的人工智慧高投入時代又重新開始了。
危險確實由此開始,但危險的來源並非人工智慧演算法進一步提升,而是因為我們提供出數據越多,被限制和引導的機會也就越大,以今天人工智慧技術水平可以做到的程度,已經可以令人非常不舒服了。未來,可使用的計算能力會增強,同時,人們提供的數據種類還會繼續增加,尤其是和人自身相關的生物特徵數據,必將讓人類放棄更多的自由,這種趨勢已經幾乎沒法扭轉了。
從現在已經發生的說起。一些網站會給不同用戶顯示不同的價格,已經不是秘密了,前幾年,酒店預訂公司Orbitz就實驗過讓蘋果用戶只能看到更貴一些的房間,據說效果還不錯,讓他們多賺了不少錢。這是基於非常簡單的規則完成的,他們把用戶直接分成兩類,蘋果用戶和其他,然後引導蘋果用戶消費。如果智能一些,可以按照用戶購買習慣,去為不同用戶提供不同的推薦方案,這我們也不陌生,在電商網站只要有帳號,哪怕只在登錄狀態搜索幾個東西,很快都會收到各種量身定做的推薦郵件。
如果運算能力足夠,讓用戶「多花點錢」這個目標,還可以做的精細很多。比如,在用戶把東西加入購物車,付款之前,能不能找到一個功能類似、價格接近但利潤率更高的商品,推薦給用戶?推薦之後,能不能給他一些應該放棄之前的商品,轉買這個商品的理由--比如有多少比例的人認為這個更好,或者,他的好友有多少人贊過它,甚至是,最近這個東西正在特價,是歷史最低價。之後,用戶買或者不買,都是一次反饋,系統會收集這種反饋,下次讓推薦方案變得更適合這個用戶。每一次重複這個過程,都可以幫助人工智慧系統提高一點點,而一個人的行為產生的數據,又可以用於影響他的好友。
這個過程還可以做的更好,比如,用戶加進購物車但沒有買的商品,如果降價20%會不會促進他立刻購買?如果不行的話,把價格漲回去,會不會讓他覺得後悔,那麼下次再降價15%,是不是立刻就買了?隨著我們把更多的數據聯網,分析用戶行為的依據會更明顯。比起過去,人們開始把越來越多的生物數據聯網,心跳,血壓…有了這些參數,之前的流程又可以發生一些變化,當降價20%的時候,用戶的生物特徵會不會改變,比如,心跳加速?如果再漲價,生物特徵又會如何變化。系統能不能從這些生物數據變化中分析出哪些是興奮,哪些是遺憾?如果漲價之後用戶感覺到遺憾,下次再降價15%,很可能會促成一次購買。這已經我們訓練程序,而是程序訓練我們。經過這種訓練之後,下一次降價20%的時候,用戶可能就會立刻購買,用戶的行為模式改變了,這就是人被程序訓練的結果。
這是一個相對直觀的例子,我們可以推測出一些理由和可以用語言表示的規則。而在實際應用中的,人工智慧程序往往是一個黑箱子,它目的是讓用戶買利潤率更高的東西。至於具體如何做,對於不同的人會有不同的方法。就算是這個黑盒子的擁有者甚至創造者,也難以窮盡所有可能,知道它到底對每一個人到底做了什麼。當然,到今天為止,這些還沒有完全成真,但我相信,小規模嘗試應該已經在進行中。沒有大規模應用,只是因為計算能力還不夠強,採集數據的方法也不夠多。簡單說,就是因為這樣做性價比還不夠高,但我相信,距離它被實現那一天並不會太遠。
我們越來越多的使用網路,也提供越來越多的數據給不同公司,而各種感測器晶元的普及,又讓我們提供了越來越多種類的數據。很多情況下,用戶甚至並不知道這些公司在收集我們的行為。一個普通用戶可能很難意識到,當他打開一個網頁停留不動,這也是一種反饋。也很難想像打開一個app,點哪個按鈕,也往往會被記錄下來。這些用戶行為數據,是"餵養"人工智慧程序最好的材料。這些80年代的科學家們難以獲得的數據,在今天它們隨處可見,用戶並不覺得它們珍貴。無論是Google,還是個人擁有的小網站,當你對它有意見時,總會有人告訴你,你又沒花錢,人家愛怎麼做就怎麼做。這當然是錯的,用戶付出數據這麼珍貴的東西,怎麼能叫免費呢?要放在幾十年前,一個人行為模式和偏好,往往只有他最好朋友和家人才有可能知道,今天不僅被各種公司獲知,還用來做了商業用途。現在的法律只保護那些能簡單對應到真實人的信息(比如證件號碼),認為那些是隱私,這些行為數據,各種公司都可以隨意收集和使用它們。每個公司都會堅稱自己有隱私保護策略,我們就算不考慮數據被竊,被泄漏的可能性,就單說不同公司之間的收購和合併,已經足以讓分布在各處的數據逐漸被匯總起來了。
今天這仍然不是一個明顯問題,雖然我們已經離不開網路,但畢竟大部分時間,我們還在現實世界中。在現實世界,一塊廣告牌立在路邊,所有人看到的都是一樣的內容,人們沒辦法和網路廣告那樣,讓每個人看到不同的廣告。
但人類必將進入虛擬世界,正如賽博朋克科幻小說所展示的那樣。隨著虛擬現實技術的發展,現實世界和虛擬世界的界限會逐漸模糊掉。去年Facebook花了大價錢收購了Oculus,這是一家沉浸式虛擬現實公司,現在它的樣子還很傻,是在頭上帶一個大盒子,人們不太可能帶著它四處行走。更早之前的Google眼鏡有著更大野心,希望成為日常應用的設備。它們的體驗都遠遠達不到實用程度。但,這個方向是一定會有實際可用產品產生。近一點,有可能是《彩虹盡頭》所描述的那種視網膜投射技術加上各種穿戴式設備構成的半虛擬現實的真實世界。更不要忘記,生化技術也在一直發展,神經聯網那一天早晚會到來。
到那個時代,我們產生,和被採集的數據就會更多。現實和虛擬的界限徹底消失,我們在現實中仍然會通過虛擬現實技術看到為每個人定製的內容。那時候人們就會有更多行為會按照人工智慧程序所規定的方式進行,並且,還會發自內心的認為那是他獨立自主的產生想法。人會完全會成為程序的終端,為程序貢獻數據,按照程序引導產生行為,依賴程序生活和工作。
就算在今天,我們也已經很難說哪些是自己的觀點,哪些是被影響過的觀點。很多人有這種感覺,看一場辯論的正反兩方文章,一會覺得這邊說的對,一會覺得那邊也有道理。這一點也不奇怪,人就是這麼容易被影響的,你很難確信什麼是你真正的想法。如果你每天看到的信息,是被程序精心計算過的,就很可能會按照程序預先設定的方式行動。為世界上每一個人設計一套適合他的模式,引導他的行為,已經不是幻想了,技術上早就可以達到,剩下的只是計算能力和成本問題。
今天的程序和人混合的模式中,人工智慧程序已經有規範我們生活的能力了,儘管這些程序沒有真正的智能,也更不可能具有超越人類的智力。這些程序按照人們不同的目的被創造出來,它們嗅探人類的習慣,改變和引導人類的行為,而他們的創造者--那些公司們,同樣是被它們所控制,難以離開他們。而且,就算是最大公司的股東們,他們自己的生活中,同樣會被別的人工智慧程序所影響和引導。人類和人工智慧,已經是密不可分的了。
想想前面說過的,對著系統說我無能為力的辦事人員,他其實已經是程序在現實世界的延伸了。即,他完全按照程序的處理結果執行,自己沒有任何其他許可權,他的工作只是替程序和現實世界交互。這是因為程序暫時還沒辦法直接影響到現實世界。如果有一天機器人足夠成熟了,他就會被機器人所替代。看看周圍,我們已經有很多的工作崗位處於這個狀態的。比如,快遞員,他們按照程序下達的指令工作,程序會替他設計最好的路線,他們只需要順著走即可,自己可以發揮的餘地很小,如果無人機成熟了,快遞員的工作也可以被取代了。人類按照人工智慧的指揮採集信息和工作,變成網路和計算機的終端,在很多討論中,這是超越人類的人工智慧出現後的事,但其實現在這種人和程序共同構成的系統已經可以實現的不錯了,很多工作崗位的人都是程序控制下的最終執行者。
80年代科幻小說設想了各種情況,但沒想到今天人們會主動把自己的數據貢獻出來。無論是潛在的用戶行為,還是顯式的照片、聲音、好友關係、品牌好惡,甚至自己的思考和情緒,在社交網路的幫助下,人們幾乎毫無保留的貢獻這一切。這個時代的人們擔心自己的身份證號被人知道,但是對於以上信息,壓根不覺得是隱私。其實身份證號才不是隱私,只要需要,有無數的方法可以獲得它,但其他信息,除了你和你的朋友們主動交出來,很難有方法直接採集到。我們很快會進入一個數據壟斷的時代,掌握海量數據的公司,可以利用這些數據獲得更好的盈利,提供更好的服務,進而繼續獲得更多數據。缺乏數據的公司,在未來可能甚至沒法創造出一個可用的服務來。
這遠比資本壟斷可怕,因為資本可以靠融資解決,數據只能通過積累獲得,壟斷者的地位更難以撼動。所以,做投資的朋友,記得投資那些可以收集和產生大量數據的公司,數據壟斷的時代馬上就會到來。
說到數據的壟斷,所有賽博朋克科幻小說,都有一個設定,即,未來企業會代替政府,成為人類社會管理者。在另一本賽博朋克經典著作《雪崩》裡面,美國聯邦政府甚至淪落到了散落在高速公路周圍的幾頂帳篷里,私人企業擁有最大的權利。但在我們所經歷的這個現實世界中,並不會如此。斯諾登曝光了稜鏡之後,人們突然發現,美國政府才是最大的數據擁有者,確切的說,美國國家安全局或者國土安全部才是真正的數據持有和壟斷者,他們不僅有通過行政手段從各職能部門獲得的數據,還從幾乎所有公司手裡要求更多數據,甚至不惜去偷數據,他們監視者全世界的人,連美國的傳統盟國也不放過。最終我們的社會形態,很可能是政府和企業共同成為壟斷者,他們和各種目的的人工智慧程序一起規範每一個人的具體行為,而大多數人對此會逐漸習以為常,一無所知。法國思想家福柯所設想的全景敞視主義,會在我們有生之年實現,以一種被監視者踴躍參與並且難以察覺的形式實現。
現實世界的實際威脅,比如IS的興起,會極大加速這種進程,每個人都可以問問自己,你是願意交出更多隱私,讓監控無處不在,從而捕獲恐怖活動的前兆,還是願意遭到恐怖襲擊?恐怖主義的威脅,會讓絕大多數人選擇前者。
最糟糕的是,今天我們已經到了一個沒法調頭回去的時代,我們沒辦法停止使用智能手機或者社交網路,也沒辦法不把數據交給大公司們。如果放棄了這些,可能已經跟被關進實際的監獄差不多了。就在幾年前,人們還習慣看看地圖出門,今天如果拿走一個人的智能手機,把他放在一個陌生的地方,他的第一反映是無所適從。就像《神經漫遊者》所描寫的,在那個已經可以通過神經聯網的時代,處罰一個人的方式,是毀掉他的神經,讓他無法再接入網路,而不是毀滅掉肉體。或者像《彩虹盡頭》所描述的那樣,如果你不能使用高科技,就基本等於是一個廢人。從現在所有的情況看,人類會毫無阻攔的奔向這個一切都在控制之下的灰暗未來,所有人都在程序的規劃之內生活,無論是這些系統的擁有者還是使用者,所有人對程序給出結果的信任都會超過對自己的信任,人類對系統極度依賴。這一天來臨的時候,很難想像人類還會有什麼進步,一切都安全,穩定,毫無意外的進行。就像《黑客帝國》裡面的人類電池,活在現實世界的電池。到這個時候,無論更遠的將來機器能不能產生超越人類的智慧,人類已經和毀滅沒什麼區別了。人類自己製造了一套系統,把全體人類關進了看不見的籠子裡面,這種情況實現的可能性,遠遠超過強人工智慧實現的可能性。
想停止這一切更加不可能,就算是在現在,試圖停止美國政府收集數據的行為很可能會被認為是叛國。這個時代還勉強可以出現斯諾登這種出乎意料的案例,斯諾登擁有許可權,但他利用這種許可權,做出了對整個系統不利的事。未來,所有人都會生活在系統劃定的規範之下,並且所有數據都被監控和計算,未來的斯諾登開始收集那些文檔的時候,他的異常行為就會被系統發現,立即中止。也許,人類唯一的希望就寄托在各種尋找漏洞的黑客身上了吧。
最後再說一個黑科技,加拿大的D-Wave甚至製造出了第一台可商用的量子計算機,當然,學術界一直在爭論它是不是真正的量子計算機,因為它幾乎只能用於計算模擬退火這一種演算法。但就算這一種演算法也很有用了,Google買了一台這種計算機,據說是用於圖像識別。圖像識別和聲音識別都是模糊現實世界和虛擬世界界限的技術。今天,計算機已經可以從攝像頭的視野中,比較準確的追蹤一張人臉,只是限於計算能力,還不能肆無忌憚的追蹤所有人,未來,一切皆有可能。
資源備註:
標題圖 截圖自電影《銀翼殺手》 Blade Runner,雖然原著是1968年,但電影是1982年的,同樣是80年代作品。
《神經漫遊者》威廉·吉布森 原著1984年出版,現在有很好的中文譯本,Denovo翻譯,強烈推薦。
《彩虹盡頭》弗諾·文奇 原著 2006年出版,有中文版。人們一直爭論弗諾·文奇的早年作品《真名實姓》和《神經漫遊者》哪個算賽博朋克開山之作,因為前者比後者早的多。但我仍然投後者一票。原因這裡寫不下了。
《雪崩》尼爾·斯蒂芬森 原著 1992年出版,有中文版。
歡迎掃一掃二維碼或搜索「cloudbigdata」關注云里數里公眾賬號
推薦閱讀:
※人人都能用的深度學習:當前三大自動化深度學習平台簡介
※人工智慧的演算法黑箱與數據正義
※扎克伯格5小時聽證鏖戰:五大焦點,四處尷尬和一次耿直CEO笑翻全場
※亂象叢生的人工智慧,有人正在薅羊毛
※【兩分鐘論文】這個AI,能夠比你更好地發現遊戲中的bug。