變革了人類社會的基礎科學,正在遭遇AI革命

來源:新智元(AI_era)

現代社會,科學是基石之一。科學的進展支撐了人類的進步,從蒸汽機到電再到汽車火箭與飛機,以及現在的信息技術以及人工智慧都是如此。

人工智慧本身是一門科學,現在,它也在變革科學。 7月7日,Science發布最新一期雜誌,《Science》以AI在科學研究中的角色為主題,製作了AI 特輯。所推薦的研究包括,AI 在物理學、天文學、生物學習、社會學等領域的巨大應用價值和潛力。

1對於科學家來說,AI的前景是最光明的:有望主導科學發現的進程

大數據迎來了自己的競賽場。

在各個領域,搜集數據的能力已經呈現爆髮式的增長:在生物學,基因和蛋白質的資料庫在飛速增長;在天文學領域,對天空的研究帶來了拍位元組(petabytes)的數據;在社會科學領域,數不清的帖子和推特紛紛從「水龍頭」上流出來。

數據洪流能推翻人類的洞見和分析,能幫助實現這種計算能力的進步也創造了新的強大工具。

在一場蔓延到眾多科學領域的革命中,研究者正在數據的洪流上使用人工智慧,通常以人工神經網路的形式。

與更早期在AI上的嘗試不一樣,這樣的「深度學習」系統不需要人類專家的知識進行編程。取而代之的,這些系統自己進學習,通常來自大型的訓練數據集,直到它們能在數據中看到模式和發現異常,這些數據集相比人類能處理的都要更大、更複雜。

AI 並不僅僅在變革科學:它能在你的智能手機上講話,能在無人駕駛汽車上與道路進行對話,並且在眾多未來學家中引起了關於大規模失業的擔憂。

對於科學家來說,AI 的前景是最光明的:AI 有望主導科學發現的進程。

但是,與一名學生或者一名博士後不一樣,神經網路不能解釋自己是如何思考的:計算機帶來的成果是不透明的。

所以它們的興起已經產生了一個稱為「AI神經科學」的領域:努力打開神經網路的黑匣子,在人們心中建立對它們產生的見解的信心。

隨著AI在科學的角色中不斷擴展,理解機器內部的「思維」也變得越來越迫切。已經有一些先鋒開始轉向AI,進行試驗設計,以及解釋結果, 開闢了全自動化科學的前景。

AI 這一不知疲倦的學徒可能很快就會變成一個成熟的同事。

2Science社論:AI、社會與人類

Eric Horvitz

Eric Horvitz 是微軟的技術院士,微軟研究院的主管。他曾擔任AAAI主席,是斯坦福百年研究報告的發起人。

【Eric Horvitz 】在關於他科幻小說的一篇文章中,艾薩夫·阿西莫夫(Isaac Asimov)反思道,「將機器人看做會無差別地摧毀製作者的危險設備」這種觀點變得十分普遍。阿西莫夫不同意這種看法,並制定了「機器人三定律」,旨在確保機器人系統安全,對人類友好。阿西莫夫提出機器人定律後幾年,「人工智慧」(AI)一詞在 1955 年被第一次提出。此後半個世紀以來,AI 已經發展為成熟的學科,有了子領域,產生了一系列方法,使計算機能夠感知、學習、推理和理解自然語言。

「深度學習」方法讓機器在模式識別方面的準確性有了出人意料的飛躍,AI 的發展越來越激動人心。這些進步已經成了消費者手中的各種功能,從語音、語音翻譯到半自動駕駛。然而,許多艱難的挑戰仍然存在,還有很多人類智能的方面讓 AI 科學家為之不解。

對AI 高漲的興趣也因其潛在缺點的擔憂而有所緩解。有些人擔心超級智能的崛起和 AI 系統失控。其他人則側重於近期可能發生的問題,關注潛在的不利後果。例如,用於指導醫療保健和刑事司法高風險決策的數據分類器,可能會遭受數據集本身所帶的偏見的影響,最終得出不公平或不準確的推論。其他亟待解決的問題還有自動化系統做出決策的法律和倫理問題,很難解釋系統是如何做出推論的,新形式的監視對公民自由構成的威脅,旨在操縱民意的自動化系統操作,AI 的犯罪行為,破壞軍事應用影響,以及可能使工人失業、擴大財富不平等。

隨著我們推動 AI 科學的發展,在短期和長期的規模上,解決 AI 對人與社會的影響至關重要。我們可以通過重點研究,監測和分析來制定有價值的評估和指導方案。AI 的影響範圍廣泛,需要跨學科團體的參與,包括計算機科學家,社會科學家,心理學家,經濟學家和律師。在長期的問題上,需要溝通交流來彌合世人關於超級智能和惡意 AI 的意見分歧。在這方面有希望的方向包括,弄清黑箱的研究,還有讓擁有軟體驗證、安全性和故障安全設計專業背景的計算機科學家和工程師一起參與工作。

好消息是,相關的研究、項目和計劃已經建成。2008 年,AAAI 主持了長期 AI 影響的多項研究,最終在加利福尼亞州的 Asilomar 舉行了一次會議。這次會議啟發了斯坦福大學《百年 AI 研究》,這是一個負責組織類似研究的項目,在一個世紀乃至更久的時間裡,每隔 5 年發布一份報告(去年發布了第一份報告)。其他最近的努力還包括,由美國國家科學院主辦的研討會和研究。去年 4 月,發表了一份關於自動化對美國勞動力影響的報告,這是兩年研究的成果。今年早些時候,來自工業界,學術界和民間社會的代表組成了一個非營利組織,名為「Partnership on AI」,旨在推薦開發和實施 AI 技術的最佳方法。

阿西莫夫在他的文章中得出結論:「我不認為如果感覺到一件事有危險,解決辦法就是不去了解它。對我來說,解決方案一定是去了解它。正視危險,就是學會如何安全地處理它。」事實上,AI的前進道路應以求知慾、關懷心和合作為指導。

3AI偵探如何打開深度學習的黑箱

深度神經網路,或者說深度學習,有著變革科學發現的潛力。但是,隨著這些網路被應用到越來越多的學科,許多以「解釋」為職業精神的科學家開始提出這樣一個問題:為什麼。模型你告訴我為什麼得到這樣一個結論?這一可解釋的問題,在行業和學術圈內刺激著新一代的研究者。正如顯微鏡揭示了細胞的原理一樣,這些研究者也在開發工具,用於理解神經網路是如何做決策的。

一些工具在不需要透視的情況下對AI進行探索;一些則是能夠與神經網路本身進行競爭和替代性工具,但是擁有更高的透明度;還有一些人使用更多的深度學習來進入到黑箱中去。總的來說,他們創造了一個新的學科,叫AI神經科學。

4【AI在行動】AI的早期證明地:尋找新粒子

粒子物理學家早在20世界80年代就開始嘗試使用人工智慧,當時「神經網路」這一術語剛剛進入大眾的想像。 這一領域依賴AI 和機器學習演算法,因為每一個實驗中心都是在數不清的、相似的複雜例子探測器中進行發掘。這正是AI擅長的地方。

粒子物理學家嘗試通過粉碎亞原子粒子帶來的巨大的能量來帶來的新物質來理解新的宇宙的內部工作原理。例如2012年,世界上最大的質子對撞機、瑞士的LHC發現的長期預測的希格斯玻色子。然而,這種異乎尋常的顆粒不附帶標籤。在幾分之一納秒之內,它們會衰變成其他粒子,物理學家必須發現那些更常見的粒子,看看它們是否與一個與同一個族系相一致的方式相配合,這些工作相對困難,因為傳統的對撞中會產生許多外族的粒子。機器學習演算法在從背景中篩選信號方面表現優異,並且可能對這一領域變得更加重要,因為LHC等機器帶來的數據量在不斷增加。

5【AI在行動】演算法如何分析大眾情緒

社交媒體每年有數以億計的用戶和數以億計的微博和帖子,為社會科學帶來了巨大的數據。社交媒體也開闢了前所未有的機會,使用人工智慧(AI)從人類大眾媒體傳播中提取意義。例如,賓夕法尼亞大學積極心理學中心使用機器學習和自然語言處理來篩選數據,衡量公眾的情緒和身體健康,包括抑鬱和信任程度以及幾種人格特質。傳統上這是通過調查完成的。但社交媒體資料便宜而豐富。不過,社交媒體也是凌亂的,而 AI 則為科學家提供了一種強大的方法,從中找出模式。

6【AI在行動】解決自閉症

對於遺傳學家來說,自閉症是一個棘手的問題。遺傳模式表明自閉症具有很強的遺傳成分。但是,已知在自閉症中發揮一定作用的幾十種基因變體,只能解釋所有病例的約 20%。尋找其他可能有助於解釋自閉症的變體需要查看 25,000 個其他人類基因及其周圍 DNA 的數據——對於人類調查人員而言任務過於繁重。因此,計算生物學家使用人工智慧(AI)工具。首先,這些研究人員結合了數百個基因組學數據集,用機器學習構建了基因相互作用的地圖。他們將少數成熟的自閉症風險基因與成千上萬其他未知基因的基因進行比較,單去年一年就發現了另外 2500 個可能參與形成自閉症的基因。現在,他們已經開發了一個深度學習工具去發現可能在自閉症和其他疾病中也發揮作用的非編碼DNA。

7【AI在行動】理解天空

天體物理學家使用人工智慧(AI)來創建類似於電影技術的東西,這些技術可以使模糊的圖像變清晰:神經網路可以使模糊的星系圖像看起來像是用比實際更好的望遠鏡拍攝的。這可以讓天文學家從觀察中得出更精細的細節。這種系統通過讓兩個神經網路相互對抗而起作用。一個是產生圖像的生成器,另一個是努力發現任何虛假內容的鑒別器,鑒別器的工作會讓生成器變得更好。研究團隊拍攝了數千個星系的真實圖像,然後人為地對它們做了降維。然後,研究人員用這些圖像訓練生成器,讓它們能夠騙過鑒別器。最終,網路在讓有噪音的星系圖片變平滑方面超越了其他技術。

8【AI在行動】化學,發現新分子

要製作一種新的分子,化學家需要從數百個分子結構單元和數千個化學反應中找出合適的搭配。從很早開始,計算化學家就利用已知的化學反應編程計算機,希望創建能夠計算出新的分子結構的軟體。但化學反應往往不是單純的成功或失敗,會產生不同濃度的產品混合物。所以,現在研究人員正在尋求人工智慧的幫助。研究人員開發了一種從數百萬次成功實驗中學習的神經網路,能夠自己選擇反應,生成新的分子。

9AI術語表:人工智慧 17 大常見詞

當人們在談人工智慧的時候,他們在說些什麼?這一詞語目前還沒有最清晰的邊界。當它在達特茅斯學院的1956年的一個會議上被推出時,它指的是,讓機器以一種人類看來是「智能」的方式運行。人工智慧的一個重要的進步是機器學習,它在拼寫檢查到自動駕駛技術中得到了展示,並且通常由稱為神經網路的計算機系統來執行。對AI的討論也可能包括其他術語。

演算法。一系列按部就班的引導。計算機演算法可以非常簡單(比如,下午三點給我發提醒),也可以很複雜(識別行人)。

反向傳播。這是許多神經網路學習的方式。他們會發現自己的輸出和計劃的輸出之間的差異,並反向調整計算進程,以進行執行。

黑箱。這是對一些深度學習系統的描述。它們拿到輸入並且提供輸出,但是,人要理解其中其中的計算過程,卻並不容易。

深度學習。一個多層的神經網路,如何對更多的抽象概念進行反應。在對一張圖片進行解析時,各層可能會首先對邊緣進行反應,然後是爪子,接下來才是狗。

專家系統。是AI的一種形式,可以嘗試複製某個領域的專家的專業知識,比如醫學診斷。它綜合了一系列知識,並通過手寫代碼進行應用。機器學習技術正在逐步取代手寫代碼。

生成對抗網路。一組共同訓練的神經網路,能生成真實的新數據,並通過競爭進行提升。一個網路提供新的樣本,另一個網路則嘗試檢驗其真假性。

機器學習。對演算法的使用,能夠在不需要精確的指導下,從數據中發現模型。一個系統可能可以學會怎樣將輸入和輸出的特徵聯繫起來,比如輸入的圖像和輸出的標籤。

自然語言處理。計算機嘗試「理解」語音和文字。它必須對詞、語法和意圖進行解析,並能夠滿足語言中的不同使用。處理過程通常包括機器學習。

神經網路。在機器學習中使用的,一個對人類大腦高度濃縮和簡化的模型。一系列單元會接收到輸入(比如,一張圖像的像素),然後進行簡單的計算,進而把它們傳遞到下一層的各個單元中。最後的一層會提供答案。

神經形態晶元。一種計算機晶元,用於執行神經網路的功能。可以進行模擬、數字化或者組合。

感知機。一種早期的神經網路類型,20世紀50年代開發。曾經被熱捧,但是最終被證明有其局限性。有一段時間,對感知機的興趣超越了神經網路。

強化學習。機器學習的一種,在其中,演算法可以通過一個完成一個抽象的目標進行學習,比如,「玩遊戲中獲得最高分」或者「讓一個工廠變得更加高效」。在訓練的過程中,演算法的每次嘗試都會基於其對最終目標的貢獻進行評估。

強人工智慧。像人一樣聰明和全面的人工智慧。有人認為這是不可能的。目前的AI還是弱人工智慧,或者說是狹義的人工智慧。它可以下象棋,或者駕駛,但是不能二者兼顧,並且缺乏常識。

監督學習。機器學習的一種類型,演算法能在訓練的過程中能夠將自己產出的輸出與正確的輸出進行對比。在非監督學習中,演算法只需要在數據集中尋找模型。

TensorFlow。谷歌為深度學習開發的一系列軟體工具集合。它是開源的,意味著任何人都能使用或者提升它。相同的項目還包括Torch和Theano。

遷移學習。深度學習的一項技術,一個演算法在執行一個任務,比如識別汽車的同時也學習相關知識,可以處理不同的任務,比如識別貓。

圖靈測試。對AI超越人類的能力的一種測試。在阿蘭·圖靈(Alan Turing)最開始設想中,AI將以其通過書面文本進行交談的能力來判斷。


推薦閱讀:

TAG:社會 | 科學 | 人類 | 基礎科學 | 人類社會 | 變革 | 革命 | 基礎 |