【數譯】人工智慧正在改變我們進行科學研究的方式

著名期刊《科學雜誌》在此文中給出了機器學習和AI在科學上的5個應用案例,涉及的領域包括物理學、心理學、生物學、天文學和化學。我們可以從中了解到,AI技術在前沿科學實驗中真的是大放異彩。

翻譯 | 七七

編輯 | 數小妹

人工智慧的早期證明:尋找新的粒子

在20世紀80年代後期,粒子物理學家開始使用人工智慧(AI)。他們的領域轉向於AI和機器學習演算法,而幾乎每個實驗都關注從複雜粒子檢測器中發現微觀的空間模式——這是AI所擅長的。伊利諾伊州巴達維亞的費米國家加速器實驗室的(Fermilab)Boaz Klima說:「我們花了幾年的時間來說服人們,這不僅僅是魔術、黑匣子。」現在,AI技術在物理學家的標準工具中佔有一席之地。

神經網路搜索LHC碰撞碎片中新顆粒的指紋

粒子物理學家通過粉碎亞原子粒子產生巨大的能量這點,力圖了解宇宙的內在作用,以發掘異質新物質。例如,在2012年,世界上最大的質子對撞機(瑞士的大型強子對撞機(LHC))發現了長期預測的Higgs boson,這是短暫的粒子,是物理學家解釋所有其他基本粒子的關鍵。

然而,這種異乎尋常的顆粒不附帶標籤。在LHC中,Higgs boson在每10億個質子碰撞中大約出現一個,在十億分之一的皮秒內,它會衰變成其他顆粒,如一對光子或稱為μ子的四重粒子。為了「重建」Higgs boson,物理學家必須發現所有更常見的粒子,看看它們是否與來自同一個系列的一致的方式相匹配 ——這是在典型的碰撞中使得外來粒子群變得更加困難的工作。

Fermilab的物理學家Pushpalatha Bhat說,像神經網路這樣的演算法優於從背景中篩選信號。在顆粒檢測器中——通常是各種感測器的巨大的組合——光子通常在稱為電磁量熱計的子系統中產生顆粒噴霧。所以電子和粒子被稱為強子,但它們的淋浴與光子的微妙不同。機器學習演算法可以通過嗅探描述淋浴的多個變數之間的相關性來分辨差異。這樣的演算法也可以幫助區分源自希格斯衰變的隨機光子對。「這是諺語中的針對乾草堆的問題,」巴特說。「這就是為什麼從數據中提取我們可以獲得的最多信息非常重要。」

機器學習沒有佔領領域。物理學家仍然依靠他們對潛在物理學的理解,找出如何搜索數據以獲取新的粒子和現象。加利福尼亞州伯克利市勞倫斯伯克利國家實驗室的計算機科學家保羅·卡拉菲羅(Paolo Calafiura)說,AI可能變得更加重要。2024年,研究人員計劃升級LHC以將碰撞率提高10倍。在這一點上,Calafiura說,機器學習對於跟上數據的洪流將至關重要。

演算法如何分析群眾的心情

每年有數十億用戶和數以億計的推特和帖子,這些社交媒體為社會科學帶來了巨大的數據。心理學家馬丁·塞利格曼(Martin Seligman)認識到,可以利用人造智能(AI)從大眾傳播中獲取意義。在賓夕法尼亞大學的積極心理中心,他和20多位心理學家、醫生和計算機科學家在世界福祉項目中使用機器學習和自然語言處理來篩選數據,以衡量公眾的情緒和身體健康。

以前這些是通過調查完成的。但是,社交媒體數據「不引人注目,價格非常便宜,而且數量巨大」,Seligman說,「雖然它也是混亂的,但是AI提供了強大的方式來整理。

在最近的一項研究中,塞利格曼(Seligman)及其同事研究了29,000名患者對抑鬱症進行自我評估的臉書的更新。使用來自28,000個用戶的數據,機器學習演算法發現在更新和抑鬱水平中的單詞之間相關聯。然後可以根據其更新成功測量其他用戶的抑鬱症。

另一項研究中,小組預測縣級心臟病死亡率為1.48億,與憤怒和負面關係相關的話語就是風險因素。來自社交媒體的預測比實際死亡率更符合10個主要危險因素(如吸煙和糖尿病)的預測。研究人員還利用社會媒體預測人格,收入和政治意識形態,研究醫院護理,神秘經歷和刻板印象。該團隊甚至根據幸福感,抑鬱症,信任和五個人格特質,從Twitter推斷,為每個美國縣建立了一幅地圖。

得克薩斯大學奧斯丁分校的社會心理學家詹姆斯·賓巴克(James Pennebaker)說:「語言分析與心理學的聯繫有一場革命。他不側重於內容而是風格,並且發現,例如,在大學錄取文章中使用功能詞可以預測成績。文章和介詞表明分析思維和預測較高的成績;代詞和副詞表示敘事思維和預測較低成績。他還發現支持1728年發生雙重錯誤的大部分可能是由威廉·莎士比亞(William Shakespeare)撰寫的:機器學習演算法與莎士比亞的其他作品相一致,基於認知複雜性和罕見詞等因素。Pennebaker說:「現在,我們可以分析您曾經發布過的所有內容,撰寫過的內容,以及您和Alexa的談話日益增多。

組合自閉症根源的基因組

對於遺傳學家來說,自閉症是一個棘手的挑戰。繼承模式表明自閉症具有很強的遺傳成分。但是已知在自閉症中發揮一定作用的數十種基因中的變體只能解釋所有病例的約20%。尋找可能貢獻的其他變體需要找到關於25,000個其他人類基因及其周圍DNA的數據的線索——這是人類調查人員的壓倒性任務。所以普林斯頓大學的計算生物學家奧爾加·特洛伊斯卡亞和紐約市的西蒙斯基金會招募了人工智慧(AI)的工具。

紐約基因組中心創始人兼紐約洛克菲勒大學醫學科學家羅伯特·達內爾解釋說:「我們只能像生物學家那樣做出自閉症等疾病的基礎。」「一個科學家可以問10個問題的機器的力量是一個遊戲規則。」

Troyanskaya結合了數百個基因在特定人類細胞中活躍的數據集,蛋白質如何相互作用以及轉錄因子結合位點和其他關鍵基因組特徵位於何處。然後,她的團隊利用機器學習建立基因相互作用圖,並將幾個成熟的孤獨症風險基因與數千個其他未知基因的基因進行比較,尋找相似之處。據報道,去年在自然神經科學上,另有2500個可能參與自閉症的基因。

但遺傳學家最近才意識到,基因並不孤立。他們的行為是由數百萬附近的非編碼基因形成的,這些基因與DNA結合蛋白質和其他因子相互作用。識別哪些非編碼變體可能會影響附近的自閉症基因是比首先找到基因更難的問題,特洛伊斯克亞的普林斯頓實驗室的研究生Jian Zhou正在部署AI來解決它。

為了將這個程序 訓練成一個深刻的學習系統,周將其暴露於DNA元素百科全書和路線圖表觀基因組學收集的數據,這兩個項目編目了成千上萬個非編碼DNA位點如何影響鄰近基因。該系統實際上學習了尋找哪些特徵,因為它評估了未編碼DNA的潛在活動。

當周和特洛伊斯卡亞在2015年10月在自然方法中描述他們的計劃DeepSEA時,加州大學爾灣分校的計算機科學家謝小輝稱之為「應用深基礎學習的里程碑」。現在,普林斯頓大學通過DeepSEA運行自閉症患者的基因組,希望對非編碼基礎的影響進行排序。

謝氏還將AI應用於基因組,儘管比孤獨症更為重點。他也希望將任何突變分類為有害的可能性。但他提醒說,在基因組學中,深度學習系統只能與訓練數據集一樣好。他說:「現在我認為人們懷疑,這樣的系統可以可靠地解析基因組。「但我認為,越來越多的人會深入學習。」 -伊麗莎白·帕尼斯

有天意的機器

今年四月份,天體物理學家凱文·沙文斯基(Michael Schawinski)在Twitter上發布了四個星系的模糊圖片,並提出了一項要求:天文學家可以幫助他分類嗎?同事們說,這些圖像看起來像橢圓和螺旋的物體。

一些天文學家懷疑,直截了當地問道,這是真正的星系?還是他們的模擬——相關物體在電腦上的建模?事實上他們都沒有,他說。在蘇黎世,計算機科學家Ce Zhang和其他合作者將星系融入神經網路中。

隨著他的Twitter帖子,Schawinski只是想看看網路的創作是如何令人信服的。但他更大的目標是創造出像電影中的技術那樣神奇地削弱模糊監控圖像的網路:一個網路可以使模糊的星系圖像看起來像是比實際更好的望遠鏡。這可以讓天文學家從觀察中擠出更精細的細節。「數千萬甚至數十億美元用於天空調查,」Schawinski說。「藉助這項技術,我們可以立即提取更多的信息。」

Twitter上發布的Schawinski是一種機器學習模型,它使兩個神經網路相互對抗。一個是產生圖像的發生器,另一個是試圖發現任何瑕疵的鑒別器,這將迫使發生器變得更好。

Schawinski的團隊拍攝了數千個星系的真實圖像,然後人為地降解了它們。然後,研究人員教會發電機再次使圖像復現,以便它們能夠滑過鑒別器。最終,網路可能會勝過其他技術來平滑星系的嘈雜圖片。

伊利諾伊州巴達維亞的費米國家加速器實驗室的天文物理學家布萊恩·北德(Brian Nord)說,Schawinski的方法是天文學中機器學習的一個特別前衛的例子,但它遠非僅有的一個。在美國天文學會1月的會議上,諾德提出了一種機器學習策略來追捕強引力透鏡:當遙遠的星系的圖像在通往地球的過程中經過扭曲的時空時,形成了天空中罕見的光線。這些鏡頭可用於測量宇宙中的距離,並發現不可見的質量濃度。

強引力透鏡在視覺上是獨特的,但很難用簡單的數學規則來描述。Nord等人意識到,經過數千個鏡頭訓練的神經網路可以獲得類似的直覺。在接下來的幾個月里,「實際上已經有幾十篇論文在尋找使用某種機器學習的強力鏡頭。「Nord說。

而且這只是天文學越來越多的實現的一部分,人造智能戰略提供了一種強大的方式來在PB級數據中查找和分類有趣的對象。沙文斯基說,「我認為在這個時代將會發生『哦,我的上帝,我們有太多的數據。『這種事情」-Joshua Sokol

神經網路學習化學合成的藝術

有機化學家是落後的專家。像主廚一樣,從成品菜的視野開始,然後研究如何製作,許多化學家從他們想要製作的分子的最終結構開始,然後考慮如何組裝它。德國明斯特大學研究生Marwin Segler說:「你需要合適的成分和一個方法來組合它們。」他和其他人現在正在將人工智慧(AI)帶入他們的分子廚房。

他們希望AI可以幫助他們應對分子製造的關鍵挑戰:從數百個潛在的構建塊中選擇,並連接數千個化學規則。幾十年來,一些化學家已經精心編程了具有已知反應的計算機,希望能夠創建一個可以快速計算出最容易分子配方的系統。然而,塞格勒說,化學「可以非常微妙。則很難以二進位的方式寫下所有規則。「

所以Segler,以及明斯特的電腦科學家Mike Preuss和Segler的顧問Mark Waller轉向AI。他們設計了一個深入的神經網路程序,而不是通過硬化和快速的化學反應規則進行編程,而是從數百萬個例子中自行學習如何去進行反應。「你提供的數據越多越好,」Segler說。隨著時間的推移,網路學會了預測合成中所需步驟的最佳反應。最終,它提出了自己從零開始製造分子的食譜。

三人測試了40個不同分子靶標的程序,與傳統的分子設計程序進行了比較。而在常規計劃中,在2小時的計算窗口中提出了合成目標分子22.5%的解決方案,AI在95%的時間裡得出結論,他們今年的一次會議上報道。即將搬遷至倫敦在製藥公司工作的塞格勒希望通過這種方法來改善藥物的生產。

加利福尼亞州帕洛阿爾托的斯坦福大學的有機化學家保羅·溫德(Paul Wender)表示,現在來看看塞格勒的方法將會如何。但是,正在將AI應用於綜合的Wender也認為「可能會產生深遠的影響」,而不僅僅是建立已知的分子,而在於尋找新的分子。塞格勒補充說,人工智慧不會很快取代有機化學家,因為他們可以遠遠超過預測。像用於化學的GPS導航系統一樣,人工智慧可能對尋找路線很有好處,但是它本身不能設計和執行完整的綜合。

當然,AI開發人員也對其他任務進行了培訓。

原文地址:

http://www.sciencemag.org/news/2017/07/ai-changing-how-we-do-science-get-glimpse

·end·

推薦閱讀:

開智慧 -
文殊菩薩的智慧,特指修證教化「一心三藏」這個大智慧
辰光幕影的智慧人生
茶,一片樹葉的智慧
智慧之語108句

TAG:科學 | 人工智慧 | 智慧 | 改變 | 方式 | 研究 | 人工 | 我們 |