有哪些將化學與人工智慧、深度學習、神經網路等計算機科學結合的研究方向?

如果有,目前的研究現狀是怎樣的?有哪些成果?未來將如何影響和改變科研以及我們的生活?


成老闆的問題,出來獻個丑,免得讓人以為我只會勸退……

這種結合可以發生在從宏觀到微觀的多個層面:

首先我慣例地要貼上這個:

http://www.nature.com/nature/journal/v533/n7601/full/nature17439.html

使用SVM和決策樹來發現無機-有機雜化材料,登上了Nature的封面——在我看來,這篇Paper最為重大的意義,並不是在於其預測準確率超過人類化學家,而是在於其模型的訓練,可以使用失敗的數據作為訓練集。

要知道,傳統的化學科研領域,很多情況下存在這樣一個問題:想Idea的工作由導師來完成,導師姿勢水平高,人生經驗(閱讀的Paper)豐富,然而對於實際實驗的情況掌控卻往往比不過做實驗的PhD——對於導師來說,精確地掌握本組海量的累積失敗數據,幾乎不可能,更何況就算掌握了,人類化學家也難以非常充分地大海撈針,從巨量數據中找出有價值的信息。

然而計算機可以做到這一點——並且從現實的角度講,一個開張幾年的組,成功數據也許沒多少,但失敗數據肯定是滿坑滿谷。能利用這些失敗數據,顯然是非常Excited的事情——當然,這需要嚴格的實驗數據管理體制和在實驗數據數字化方面持之以恆的能力,考慮到國內很多組黑瞎子掰苞米,實驗記錄本滿天飛的尿性……

再往上一個層面,就是通過對藥物分子化合物庫的學習來找到有意義的藥物分子結構——這個其他答案已經說了。這裡說明一下,我們實際上可以把結構式抽象成數據結構中的圖,然後圖各條邊就是化學鍵,邊的權值就是化學鍵鍵能和其他數據,利用圖論演算法跟深度神經網路,目前已經可以找到有藥物效果的新分子了。

到微觀層面,就是直接搶理論化學的飯碗——前段時間Google新發了兩篇Paper(正主在樓下@李力):

https://arxiv.org/abs/1702.05532

https://arxiv.org/abs/1704.01212

從機器學習的角度看,分子數據非常有趣的一個原因是:一個分子的自然表徵就像是一個圖(graph),其中原子是節點(node)、鍵是邊(edge)。能夠利用數據中固有的對稱性的模型往往能更好地進行歸納——卷積神經網路在圖像上的成功的部分原因是它們有能力整合我們關於圖像數據的不變性(比如,將一張狗的圖像轉移到左邊,仍然還是一張狗的圖像)的先驗知識。圖對稱性的不變性是計算圖數據的機器學習模型尤其期望的性質,在這一領域也有大量有趣的研究(如 Li et al.、Duvenaud et al.、Kearnes et al.、Defferrard et al.)。但是,儘管已經取得了這些進展,但仍然還有許多工作要做。我們希望為化學(和其它)應用找到這些模型的最好版本,並描繪本文獻中所提出的不同模型之間的聯繫。

我們的 MPNN 在 QM9 中的所有 13 種化學性質上都達到了當前最佳的預測表現。在這個特定的分子集合上,我們的模型能以對化學家足夠有用的準確度預測其中的 11 種性質,而其速度可以達到使用 DFT 模擬的 300,000 倍。但是,在化學家可以實際應用 MPNN 之前,還有很多工作要做。特別地,MPNN 必須被應用到比 QM9 遠遠更加多樣化的分子集合上(比如,更大的或帶有更多變的重原子集合)。當然,即使有更接近真實情況的訓練集,也仍然難以很好地泛化到非常不同的分子上。克服這兩個難題將涉及到機器學習領域的核心問題(比如泛化)上的進步。

因為成老闆不是搞這個的,這裡也就不討論演算法細節了(事實上真要深入討論的話我自己也沒研究到那個程度……)

我直接說結論——實際上,將CS工具引入化學,引入的是一種用統計代替解析的思想:在自然語言處理領域,最初的方法是像編程語言一樣,寫語法規則做語法分析然後得到語法樹再做下一步考慮。然而編程語言是上下文無關文法,自然語言是上下文相關文法——都是主謂賓結構,「我喝水」是合乎語法的,也是對的,「我喝飯」也是合乎語法的,卻是錯的。於是基於規則的方法很快就走進了死胡同——要寫的規則實在太多了。目前使用的是基於統計的方法——我不考慮一個詞A到底是什麼成分,我只看這個詞A出現在另一個詞B後面的概率有多大……

同樣,目前化學領域主要面臨的問題是理論工具(或者說「非實驗工具」)太過於孱弱——因為使用DFT求薛定諤方程的近似解需要的時間開銷過於龐大。於是同樣的道理,現在我們已經累積了足夠的現象,為什麼不試試用統計的方法,試著繞過薛定諤方程來預測分子的性質呢

更進一步地想,導師看Paper,想Idea,這個過程,其實就是一個「人腦神經網路」的過程——既然這樣的話,我們為什麼不能用電腦輔助(完全代替難度太大)這個過程呢?


推一下 MIT CSAIL 和 Chemical Engineering Department 今年的NIPS論文。

預測/生成有機物合成結果。模型超過人類專家表現。

Predicting Organic Reaction Outcomes with Weisfeiler-Lehman Network

http://people.csail.mit.edu/wengong/papers/nips17reaction.pdf

Neural Information Processing Systems (NIPS), 2017


我們最近的一個工作在nature communications上發表了

Bypassing the Kohn-Sham equations with machine learning

用機器學習近似密度泛函,推廣到了三維的真實分子。我們用機器學習結合DFT的方法做了一個Malonaldehyde Proton Transfer的模擬。

以前我們在toy system上研究了其可行性

Finding Density Functionals with Machine Learning

Understanding machine‐learned density functionals

推廣到了所有的一維繫統,從分子到熱力學極限,包括強關聯體系

Pure density functional for strong correlation and the thermodynamic limit from machine learning

我2017年10月加入了Google Accelerated Science Team 希望用google積累的機器學習的技術,來解決自然科學的問題,加速自然科學領域的發展。 @到處挖坑蔣玉成 回答中提到的google的兩篇文章就是我們組發的。

如果你有有趣的問題,我們可以交流一下。


因為本人目前畢設就是做這個方向的,故而來怒答一發。

正如前面的答主所說,將機器學習方法用在化學裡面地例子已經有很多。各種機器學習方法可以被用來預測化合物的毒理性,如急性毒性、皮膚敏感性以及各種慢性毒性,如致癌性、致畸性、對各種臟器的毒性等等。這些問題共同的特點在於,造成該性質的機理可能相當複雜甚至尚不明確,而且不同的化合物的毒理各不相同,可能與不同的通路中不同的靶標作用,因此難以用傳統計算化學的方法進行預測。

要做這樣的研究,首先需要解決兩個重要問題,即數據來源,以及表示化合物的方法。數據來源因研究的問題不同而有異,像毒理性這種只能是遇上一條記一條,數據量通常不會很大,而且通常極不平衡(正樣本太少)。而如果是像本人現在畢設所做的,化合物對某種酶的抑制效應的預測的話,可以通過高通量實驗獲取上萬條的數據。

對於描述一個化合物的方法,目前有很多現成的軟體可以計算成套的化合物描述符(descriptor),比如PaDEL啊Mold2啊Dragon啊,還有各種類型的fingerprint,比如FP4、MACCS、ECFP等。這些描述符會計算化合物的一些結構信息,比如包含幾個芳香環啦,有幾個sp2雜化的碳原子之類的,也會計算化合物的電荷分布還有極性等性質。對於fingerprint型的描述符,一個向量中的每個元素對應一種官能團,其數值為該官能團在化合物中出現的次數或者出現與否(0-1值)。這種描述符的缺點也是顯而易見的,化合物的信息在某種程度上被壓縮了。2013年,Alessandro Lusci等人發展了一種名為無向圖遞歸神經網路(Undirected Graph Recursive Neural Networks, UGRNN)的演算法,用於化合物小分子結構的編碼,並用此方法預測了化合物的水溶性[1]。我們課題組將此方法應用於藥物的肝毒性(Drug Induced Drug Injury, DILI)預測,獲得了較好的預測結果,其預測能力遠高於現有的其它DILI預測模型[2]。

深度學習應用於化學信息學的例子還有很多,如2012年,Merck公司發布了一個針對多個QSAR問題的建模比賽,每個問題的數據包含了幾千到幾十萬個分子結構及其各種屬性值,以及幾千乃至上萬個提前計算好的描述符。George Dahl等人提交的使用了多目標深度神經網路的模型獲得了優勝[3]。Thomas Unterthiner 等人也利用多目標深度神經網路方法學習了化合物的毒性預測模型,他們用 NIH, EPA 和 FDA 提供的 Tox21 數據集(大約 12000 個化合物,12 個毒性預測任務),使用深度神經網路方法建模,預測的精度同樣高於其他機器學習方法[4]。

目前本人畢業設計所做的課題是用深度學習方法預測化合物對某種酶的幾個亞型的抑制效應。由於這種酶是可以催化的底物種類很多,底物口袋很大,可變性強,缺乏特異性,因此難以用傳統分子對接的方法去研究。事實上這個問題已經算是被做爛了……SVM啊k-NN啊naive-Bayes啊決策樹啊等方法都有人嘗試過。本人是用深度神經網路進行預測,目前對單個亞型的預測效果已經好於先前的工作了,當然之後還有很多需要嘗試的東西……嗯就不說了。

參考文獻

[1] Lusci A, Pollastri G, Baldi P. Deep architectures and deep learning in chemoinformatics: the prediction of aqueous solubility for drug-like molecules[J]. Journal of chemical information and modeling, 2013, 53(7): 1563-1575.

[2] Xu Y, Dai Z, Chen F, et al. Deep Learning for Drug-Induced Liver Injury[J]. Journal of chemical information and modeling, 2015, 55(10): 2085-2093.

[3] Ma J, Sheridan R P, Liaw A, et al. Deep neural nets as a method for quantitative structure–activity relationships[J]. Journal of chemical information and modeling, 2015, 55(2): 263-274.

[4] Unterthiner T, Mayr A, Klambauer G, et al. Toxicity prediction using deep learning[J]. arXiv preprint arXiv:1503.01445, 2015.


DeepChem

學one-shot之餘灌一發

[1611.03199] Low Data Drug Discovery with One-shot Learning


去Arxiv上搜下就可以看到,舉幾個例子:

[1703.01925] Grammar Variational Autoencoder

[1701.01329] Generating Focussed Molecule Libraries for Drug Discovery with Recurrent Neural Networks


有人用Deep learning跑分子結構做藥物設計。貌似已經是半個成熟的領域了。我很看好這種技術。



靈魂阿賴耶識 人工智慧自我意識與情感 感知理解反思處境行為 學習記憶推理建模 博弈非完整信息 盲人畫家

靈魂阿賴耶識 人工智慧自我意識與情感 感知理解反思處境行為 學習記憶推理建模 博弈非完整信息 盲人畫家

西安交通大學教授鄭南寧:人工智慧的下一步是什麼?―中國教育和科研計算機網CERNET

西安交通大學教授鄭南寧:人工智慧的下一步是什麼?

2016-12-15 中國教育網路

院士談信息領域的顛覆性技術

編者按:

  10月25~26日,「國際工程科技發展戰略高端論壇——信息領域的顛覆性技術」在西安開幕,百餘名國內外院士、專家出席,現場聽眾近700人。本次論壇的主題是「信息領域的顛覆性技術」。論壇由中國工程院主辦,西安交通大學、中國工程院信息與電子工程學部共同承辦,是中國工程院信息學部最重要的年度學術活動。本屆論壇設置主題演講、分論壇兩大環節,26位專家將各自研究領域所獲得的傑出成就發表演講,研究範圍涉及人工智慧、認知計算、人機交互、雲計算、知識自動化、機器人、大數據、虛擬現實、集成電路、高性能計算、空天一體化信息網路、計量檢測等領域。擷取部分與會嘉賓的精彩觀點與讀者一起分享。

鄭南寧:人工智慧的下一步是什麼?

鄭南寧:中國工程院院士、西安交通大學電信學院教授

  隨著2006年Hinton等人提出深度學習概念,人工智慧研究進入了嶄新的發展時期,也不斷地影響、推進著相關眾多產業、行業的快速發展。人工智慧「精彩回歸」,重新受到學術界、產業界等社會各界的廣泛關注。

  人工智慧是研究人類智能活動的規律,構造具有一定智能的人工系統,使機器能夠像人一樣思維和認知。當前人工智慧的研究前沿之一是如何實現由完整信息到非完整信息的處理,構建更加健壯的人工智慧,使人工智慧系統對用戶錯誤、目標偏差、錯誤模型以及未建模對象具有更好的適應性。無人駕駛就是一種典型的非完整信息處理問題。

  由於我們不可能為所有的問題建模,「未知的未知」問題對構建穩健的人工智慧系統提出了挑戰。為了設計更加健壯的人工智慧,需要採用穩健優化、學習因果模型和組合模型等方法來提高人工智慧建模問題的穩健性。

  要設計更加健壯的人工智慧,首先要提升對於模型錯誤的穩健性,對風險敏感的目標進行優化,採用穩健推理的演算法,如採取謹慎的策略提升應對建模錯誤情況下的魯棒性;其次,需提升對於為建模問題的穩健性,擴充模型、學習因果模型、採用組合模型監測模型表現以檢測異常等。

  從人工智慧的研究來看,我們長期以來堅持兩個目的:一是如何使機器更加聰明,二是如何用機器模擬人的智能,同時能夠發展出更聰明的機器幫助人類更好地發展。從人的角度來思考,建立一種智能系統需要以下基本的因素:它必須要適應我們的世界,要具備學習的能力,同時需要有記憶能力,在學習記憶的基礎上完成推理,另外在推理的過程中還必須建立一種因果模型。

  直覺推理可以看成兩個方面:一個是物理層面的推理,就是可以跨越時間尺度給出判斷和情景演變的過程;另一個是心理層面的推理。無人駕駛車事故的例子,說明無人駕駛車是在非完整信息下出現的問題。如何在不完整信息下讓機器做出正確判斷,使得機器具有推理和自主學習的能力,這樣的過程是健壯的人工智慧能夠實現的。

  人的認知過程,在很多場合下是從全局到局部的,在大量先進知識的前提下,往往是一種自上而下的過程。我們做了一個讓計算機實現對人體運動進行分析的實驗,並選擇了樂團的指揮。樂團的指揮實際上是樂團的靈魂,在樂團演出中每一個人都要按照指揮的動作把曲子用自己演奏的樂器表達出來。通過身上的標記點把指揮的動作通過攝像機模擬出來,把一個指揮家的動作合成以後,我們讓機器來指揮。

  人工智慧是一門綜合性的前沿學科和交叉學科,其發展與信息科學、認知科學、神經生物學、心理學、數學等學科深度融合。發展人工智慧要做到「兩手抓」,即一方面要踏踏實實積極推進人工智慧的基礎理論研究,另一方面要重視人工智慧在重大學科領域和重大工程中的實踐應用。開展科學研究的目的是造福人類,但在歷史進程中,科學技術也曾被別有用心者利用而阻礙了社會發展,甚至給人類帶來災難。

  實現類人水平的人工智慧還需要迎接哪些挑戰?一是如何讓機器在沒有人類的幫助下學習,二是如何讓機器像人類一樣感知和理解世界,三是如何讓機器具有自我意識、情感以及反思自身處境與行為的能力。使機器具有自我意識和反思能力是類人智慧最難的挑戰,無論對科學和哲學來說,這都是一個引人入勝的探索領域。

  未來三十年,人工智慧將在計算能力、人工智慧系統等方面催生顛覆性技術,其研究成果將在社會管理、國防、生命健康、金融、能源、農業、工業等眾多領域大放光彩,人工智慧也將迎來新的發展高潮。未來,人工智慧將滲透到人們生活中的各個角落,成為人們生活中不可或缺的組成部分。

  (本文根據鄭南寧在「國際工程科技發展戰略高端論壇」上的講話整理,未經本人確認)

=-===========================================================================

中國工程院院士鄭南寧:人工智慧發展應明確方向

中國工程院院士鄭南寧:人工智慧發展應明確方向_人工智慧,機器,挑戰,智能製造及工業4.0-中國智能製造網

2016年06月21日 11:32:28中國智能製造網人氣:30906

  【中國智能製造網 名家論談】不久前,圍棋軟體「阿爾法圍棋」戰勝圍棋世界冠軍李世石,讓人們驚嘆人工智慧發展取得的成就。這是否意味著機器即將獲得類人智能呢?現在得出這樣的結論還為時過早,但確實需要思考人工智慧的發展方向問題。

中國工程院院士鄭南寧:人工智慧發展應明確方向

當前,人工智慧在發展中面臨三大挑戰。

第一大挑戰是讓機器在沒有人類教師的幫助下學習。人類的很多學習是隱性學習,即根據以前學到的知識進行邏輯推理,以掌握新的知識。然而,目前的計算機並沒有這種能力。

迄今為止,最成功的機器學習方式被稱為「監督式學習」。與老師教幼兒園孩子識字一樣,機器在每次學習一項新技能時,基本上都要從頭開始,需要人類在很大程度上參與機器的學習過程。要達到人類水平的智能,機器需要具備在沒有人類過多監督和指令的情況下進行學習的能力,或在少量樣本的基礎上完成學習。也就是說,機器無須在每次輸入新數據或者測試演算法時都從頭開始學習。

【修行人解讀 人類的學習能力依據唯識學,關鍵是阿賴耶識種子依,人類的學習能力是存在於人的整個生命體的靈命之中。後天的教育與學習,不是人類學習能力的全部,否則不能解釋莫扎特8歲就可以作曲,並且8是的作品一直流傳至今,不斷演奏而具有生命的感召力。也許隨著科學的發展,阿賴耶識的種子依,也會被人類證明。人工智慧現在只是被動的監督式學習,達不到主動地隱性學習,更談不到阿賴耶識種子的流轉】

第二個挑戰是讓機器像人類一樣感知和理解世界。觸覺、視覺和聽覺是動物物種生存所必需的能力,感知能力是智能的重要組成部分。在對自然界的感知和理解方面,人類無疑是所有生物中的佼佼者。如果能讓機器像人類一樣感知和理解世界,就能解決人工智慧研究長期面臨的規劃和推理方面的問題。雖然我們已經擁有非常出色的數據收集和演算法研發能力,利用機器對收集的數據進行推理已不是開發先進人工智慧的障礙,但這種推理能力建立在數據的基礎上,也就是說機器與感知真實世界仍有相當大的差距。如果能讓機器進一步感知真實世界,它們的表現也許會更出色。要達到人類水平的智能,機器需要具備對自然界的豐富表徵和理解能力,這是一個大問題。儘管圍棋很複雜,讓計算機在棋盤上識別最有利的落子位置也很難,但與精確地表徵自然界相比,描述圍棋對弈的狀態顯然要簡單得多,兩者之間的差距還要幾十年甚至更長時間才能彌合。

【修行人解讀 人類之所以具有感知和理解世界的能力,首先是人類文明4萬年以來發展與進化的結果。在印尼的原始森林的存在的原始部落,由於他們與現代社會存在數千年的隔絕,原始部落的人群的感知和理解的世界,就與現代社會人群感知和理解的世界大大不同,原始部落拋棄吃人的高尚習俗還是近30年的事情。

所以,對於人類為何具有的感知和理解世界的能力,是屬於人類意識與靈魂的範疇,作為科學家的院士,有此犯下凡重大失誤也是可以理解。鄭南寧,男,漢族,1952年12月生,祖籍陝西西安,出生於江蘇南京。1975年畢業於西安交通大學電機工程系;1981年西安交通大學獲工學碩士學位。畢竟院士的生活的年代與社會環境背景是那樣的。

但是院士對於人類的博弈與計謀,還是有深刻的認知。儘管圍棋很複雜,讓計算機在棋盤上識別最有利的落子位置也很難,但與精確地表徵自然界相比,描述圍棋對弈的狀態顯然要簡單得多,兩者之間的差距還要幾十年甚至更長時間才能彌合。】

第三個挑戰是讓機器具有自我意識、情感以及反思自身處境與行為的能力。這是實現類人智能最艱難的挑戰。具有自我意識以及反思自身處境與行為的能力,是人類區別於其他生物最重要、最根本的一點。另外,人類的大腦皮層能力是有限的,如果將智能機器設備與人類大腦相連接,不僅會增強人類的能力,而且會使機器產生靈感。讓機器具有自我意識、情感和反思能力,無論對科學和哲學來說,都是一個引人入勝的探索領域。

【修行人解讀 人工智慧具有人類自我意識,是完全不可能的。人類的自我意識,是因為人類與宇宙生命體是一體的。人類至今都無法解讀意識的機理,今後也解讀不了。靈命與靈魂問題,是一個遠遠超越人類本身的哲學問題,也是人類的終極問題。

世界,也許就是一個宇宙大生命的模擬的、夢幻的鏡像,宇宙的本體在哪裡呀?這是一個不是人工智慧的科學院士,可以回答的問題。】

人工智慧的發展能不斷幫助人類,但它同時也是一把「雙刃劍」。我們要警惕人工智慧給人類帶來的負面影響,關注人工智慧的發展將帶來的深刻倫理道德問題。我們需要的是幫助人類而不是代替人類的人工智慧。發展人工智慧的目的不是把機器變成人,也不是把人變成機器,而是要擴展人類的智能,解決人類社會發展面臨的重大問題。這是科學界、各國政府和人類社會在人工智慧發展上應認真對待的問題。需要確立倫理道德的約束監督機制,使人類免受人工智慧不當發展帶來的負面影響。(來源:人民日報 原標題:中國工程院院士鄭南寧:發展有助於人類的人工智慧)

文章鏈接:中國智能製造網 http://www.gkzhan.com/news/detail/88302.html

============================================================================

鄭南寧:發展強人工智慧需從腦認知和神經科學尋求啟示

鄭南寧:發展強人工智慧需從腦認知和神經科學尋求啟示-新聞-科學網

當前,人工智慧已經成為席捲社會各界的熱潮。今年7月,國務院印發了《新一代人工智慧發展規劃》,一系列支持政策和措施正在逐步推進。在日前在濟南舉辦的2017中國自動化大會上,中國工程院院士鄭南寧向記者表示,當前,人工智慧滲透到了社會各個領域,但目前來看,無論是深度學習還是其它方法,解決的都是單一問題,而人類大腦是一個多問題求解的結構,「當前急需發展強人工智慧,而這可以從腦認知和神經科學中得到啟示」。

鄭南寧指出,人類面臨的許多問題都具有不確定性、脆弱性和開放性。今天人工智慧的理論框架,建立在演繹邏輯和語義描述的基礎方法之上,但我們不可能對人類社會所有問題都進行建模,因為我們不能把一個行為的所有條件都模擬出來,這就是傳統人工智慧的局限性。

「因此,我們要建造一種更加健壯的人工智慧,需要腦認知和神經科學的啟發」,鄭南寧指出,計算機和人類大腦是為問題求解的物質基礎。在智力和計算能力方面,計算機遠遠超過了人類,但是人類面對的大部分問題都是開放的、動態的、複雜的,大腦在處理這種問題時表現出的想像和創造,還有對複雜問題的分析和描述,是傳統人工智慧方法所不能企及的,因此,我們只能從人類大腦的神經網路結構中,去獲得構造新的人工智慧的因素。

鄭南寧介紹,人類大腦非常奇妙,正是在這個物質基礎之上,才演義出人類世界的發展和為問題求解的各種方法,「大腦不是通過一個統一的、未分化的神經網路,來實現單一的全景優化學習。大腦是模塊化的,具有獨特且相互作用的系統來支持認知功能,如記憶、注意、語言和認知控制。腦認知和神經科學的研究成果,可以為解決人工智慧長期存在的規劃與推理問題提供新的方法」。

鄭南寧進一步介紹,人的大腦有800億個神經元容量。我們可以通過大腦的結構連接、功能連接和有效連接的聚合與分離來洞察大腦的認知機理,「大腦的結構連接是相對靜態的,而功能連接和有效研究則具有時空動態演化的特性。有效連接描述了神經元之間的因果與相互影響關係」。

「直覺推理、認知推理和因果模型是構建健壯的人工智慧必須考慮的基本因素」,鄭南寧最後表示。

=========================================================================

【解讀新一代人工智慧規劃】鄭南寧院士:混合增強智能——協同與認知

【解讀新一代人工智慧規劃】鄭南寧院士:混合增強智能——協同與認知

2017-08-04 16:06人工智慧/操作系統/人類

人工智慧是一種引領許多領域產生顛覆性變革的使能技術,合理並有效地利用人工智慧技術,意味著價值創造和競爭優勢。為搶抓人工智慧發展的重大戰略機遇,依託我國應用需求和市場的巨大優勢,加快建設創新型國家和世界科技強國,在黨中央、國務院統一部署和要求下,《新一代人工智慧發展規劃》(以下簡稱規劃)對我國人工智慧發展戰略做了全面部署,明確了我國人工智慧發展的總體要求及三步走的戰略目標,並將人機協同的混合增強智能作為規劃部署的五個重要方向之一。

智能機器與各類智能終端已經成為人類的伴隨者,人與智能機器的交互、混合是未來社會的發展形態。人機協同的混合增強智能是新一代人工智慧的典型特徵。

當前的人工智慧系統在不同層次都依賴大量的樣本訓練完成有監督的學習。真正的通用智能會在經驗和知識積累的基礎上靈巧地無監督學習。如果僅僅是利用各種人工智慧計算模型或演算法的簡單組合,不可能得到一個通用的人工智慧。特定領域的人工智慧系統如谷歌的Alpha Go、IBM的深藍和Watson等依賴強大的計算能力在挑戰人類智力方面取得了巨大進步,但這些系統還無法通過自身思考得到更高層次的智能,它們與具有高度自主學習能力的通用人工智慧依然存在著差距。但是,人工智慧在這些特定領域應用的巨大成功為我們研究與發展新一代人工智慧提供了重要的借鑒和新的方法。

人類面臨的許多問題具有不確定性、脆弱性和開放性,也是智能機器的服務對象和最終「價值判斷」的仲裁者,因此,人類智能與機器智能的協同是貫穿始終的。任何智能程度的機器都無法完全取代人類,這就需要將人的作用或認知模型引入到人工智慧系統中,形成混合-增強智能形態,這種形態是人工智慧或機器智能的可行的、重要的成長模式。

混合增強智能形態可分為兩種基本實現形式:人在迴路的混合增強智能,基於認知計算的混合增強智能。

一、人在迴路的混合增強智能

將人的作用引入到智能系統中,形成人在迴路的混合智能範式。在這種範式中人始終是這類智能系統的一部分,當系統中計算機的輸出置信度低時,人主動介入調整參數給出合理正確的問題求解,構成提升智能水平的反饋迴路。

把人的作用引入到智能系統的計算迴路中,可以把人對模糊、不確定問題分析與響應的高級認知機制與機器智能系統緊密耦合,使得兩者相互適應,協同工作,形成雙向的信息交流與控制,使人的感知、認知能力和計算機強大的運算和存儲能力相結合,構成「1+1&>2」的智能增強智能形態。

在當前大數據、深度學習在不同領域不斷取得突破性成果之際,更需要清楚認識到,即使為人工智慧系統提供充足、甚至無限的數據資源,也無法排除人類對它的干預。例如,面對人機交互系統中對人類語言或行為的細微差別和模糊性的理解,特別是將人工智慧技術應用於一些重大領域(如產業風險管理、醫療診斷、刑事司法、自主駕駛、社會輿情分析、智能機器人等)時,如何避免由於人工智慧技術的局限性而帶來的風險、失控甚至危害?這就需要引入人類的監督與互動,允許人參與驗證,提高智能系統的置信度,以最佳的方式利用人的知識,最優地平衡人的智力和計算機的計算能力,從而實現大規模的非完整、非結構化知識信息的處理,有效避免由於當前人工智慧技術的局限性而引發的決策風險和系統失控等問題。

二、基於認知計算的混合增強智能

在人工智慧系統中引入受生物啟發的智能計算模型,構建基於認知計算的的混合增強智能。這類混合智能是通過模仿生物大腦功能提升計算機的感知、推理和決策能力的智能軟體或硬體,以更準確地建立像人腦一樣感知、推理和響應激勵的智能計算模型,尤其是如何建立因果模型、直覺推理和聯想記憶的新計算框架。

對當前人工智慧而言,解決某些對人類來說屬於智力挑戰的問題可能是相對簡單的,但是解決對人類來說習以為常的問題卻非常困難。例如,很少有三歲的孩童能下圍棋(除非受過專門的訓練),但所有的三歲孩童都能認出自己的父母,且不需要大量經過標註的人臉數據集的訓練。人工智慧研究的重要方向之一是借鑒認知科學、計算神經科學的研究成果,使計算機通過直覺推理,經驗學習將自身引導到更高層次的。

另外,在現實世界中,人們無法為所有問題建模,這裡存在條件問題(Qualification Problem)和分支問題(Ramification Problem),即不可能枚舉出一個行為的所有先決條件,也不可能枚舉出一個行為的所有分支。而人腦對真實世界環境的理解、非完整信息的處理、複雜時空關聯的任務處理能力是當前機器學習無法比擬的,還有人的大腦神經網路結構的可塑性,以及人腦在非認知因素和認知功能之間的相互作用,它們是形式化方法難以、甚至不能描述的。人腦對於非認知因素的理解更多的來自於直覺,並受到經驗和長期知識積累的影響。人腦所具有的自然生物智能形式,為提高機器對複雜動態環境或情景的適應性,以及非完整、非結構化信息處理和自主學習能力,為構建基於認知計算的混合-增強智能提供了重要啟示。

認知計算架構可以將複雜的規劃、問題求解與感知和動作模塊相結合,有可能解釋或實現某些人類或動物行為以及他們在新的環境中學習和行動的方式,可以建立比現有程序計算量少得多的人工智慧系統。在認知計算的框架下,可以構建更加完善的大規模數據處理和更多樣化的計算平台,也可為多代理系統解決規劃和學習模型的問題,以及為新的任務環境中的機器協同提供新的模式。

人工智慧追求的長期目標是使機器能像人一樣感知世界和解決問題。當前的人工智慧已不是一個獨立、封閉和自我循環發展的智能科學體系,而是通過與其他科學領域的交叉結合融入到人類社會進化的過程中,並將深刻改變人類社會生活,改變世界。

【修行人解讀 人類之所以具有感知和理解世界的能力,首先是人類文明4萬年以來發展與進化的結果。在印尼的原始森林的存在的原始部落,由於他們與現代社會存在數千年的隔絕,原始部落的人群的感知和理解的世界,就與現代社會人群感知和理解的世界大大不同,原始部落拋棄吃人的高尚習俗還是近30年的事情。

所以,對於人類為何具有的感知和理解世界的能力,是屬於人類意識與靈魂的範疇,作為科學家的院士,有此犯下凡重大失誤也是可以理解。鄭南寧,男,漢族,1952年12月生,祖籍陝西西安,出生於江蘇南京。1975年畢業於西安交通大學電機工程系;1981年西安交通大學獲工學碩士學位。畢竟院士的生活的年代與社會環境背景是那樣的。

但是院士對於人類的博弈與計謀,還是有深刻的認知。儘管圍棋很複雜,讓計算機在棋盤上識別最有利的落子位置也很難,但與精確地表徵自然界相比,描述圍棋對弈的狀態顯然要簡單得多,兩者之間的差距還要幾十年甚至更長時間才能彌合。】

【修行人解讀 人工智慧具有人類自我意識,是完全不可能的。人類的自我意識,是因為人類與宇宙生命體是一體的。人類至今都無法解讀意識的機理,今後也解讀不了。靈命與靈魂問題,是一個遠遠超越人類本身的哲學問題,也是人類的終極問題。

世界,也許就是一個宇宙大生命的模擬的、夢幻的鏡像,宇宙的本體在哪裡呀?這是一個不是人工智慧的科學院士,可以回答的問題。】

==============================================

https://zhuanlan.zhihu.com/p/31699318嘉露蓮、布琴科夫、派保、菲蒂帕、沈冰山盲人畫家 30歲失明Bramblitt現能見更多顏色 陶進失明人水墨世界

說起繪畫藝術來,許多人都說:畫畫是視覺藝術。確實,繪畫藝術作品的創造靠直覺和直觀,但人們往往把這直觀的「觀」簡單地理解為是視覺。在中國傳統文化中「直觀」不僅包括眼睛「看」這種「觀」,而且包括遠遠超過這種意義的深刻認識。「觀」這個詞,在中國傳統文化中,其意義是繁多的,但是,有幾層意義,是值得特別重視的。在《說文解字》中,釋「觀」為「諦視也」。「諦」則釋為「審」。就是說,這種「觀」不是一般的看,它要達到的目的,也不是一般所要達到的目的。這在《易傳》中,更明確地指出:「常事曰視,非常曰觀」。老子在《道德經》中所用之「觀」,正是在這種「非常」的意義上。「道可道,非常道」。其所指是,「道」乃「非常」,不可言說。雖然不可言說,但卻可以「觀」。因此,「直觀」就中國傳統文化而言,必須從超越眼睛看這種意義上去領會,才能進入事情的本質。

其實,人了解信息和掌握信息是有很多渠道的,人的六根②即眼、耳、鼻、舌、身、意的互用就足以證明了這一點。當然,眼睛是最便捷獲得信息的渠道之一,但並不是唯一。著名科學家錢學森教授說:「有的人與常人不同的實踐,也就有一種特別的思維,他能處理普通人扔掉的信息」。每當我帶著盲人繪畫班的學生去公園、郊外去寫生花卉時,盲人學生都能用手辯認出紅花、藍花、白花……這是因為不同色彩的花朵在溫度上有一點點差別,而使盲人認出它們的顏色,這叫以手代目;每當我帶著盲人學生去樹林中畫樹時,總會有盲人對我說:「這有一隻美麗的小蟲站在樹葉上」,我看了半天都沒看見,於是盲人拉著我朝他嗅到氣味的方向走去,把樹葉一翻開,原來漂亮的小蟲就在我們身邊,我卻看不到。然而盲人以鼻代目卻看到了並在地上畫給我看「它是園形的紅色的,然後在紅色的園中有規律的點上七個黑點」此時,七星螵蟲活靈活現的展示在我眼前;每當我帶著盲人學生到山裡去畫大山時,盲人學生通過雙耳聽山中的迴音,從而觀察出山的近遠、大小、多少並畫出來。這叫做以耳代目。這就是普通人扔掉的信息,即認定沒有眼睛觀察就無法做畫的道理。

從遠古記載的所有資料中,我們也可以清楚地看到這樣一個事實,在人類還沒有創造出文字之前人類就用繪畫、舞蹈等進行交流,這就是與人類象思維有關的形象思維的問題。是的,象思維乃是人生來的一種本能,一種本原性的思維③。只是這種「本能」或「本原」在概念思維占統治地位,或者說概念思維成為思維「常態」之後,人的這種「本能」或「本原」就經常被遮蔽或被抑制,久而久之甚至有所退化。例如,傳統中國文人,許多人都是琴、棋、書、畫四樣都會的,至少精通書法、會作詩。但是,現在,就是從中文系畢業,從事文化或文藝事業的人,不用說琴、棋、書、畫中四種都會,就是能作詩的,又有幾個?在這裡,確實可用老子的名言「為學日益,為道日損」來解釋這種「退化」現象。老子批評的「學」,在春秋末期,主要是指儒家為代表的「禮樂」文化。「禮」之「明份」,「樂」之「合同」,無論是作為理論規定,還是作為治國的典章制度,都是一種理性化的表現。從思維方式上看,也是強化概念思維的表現。為什麼「為學日益,為道日損」?就在於作為「禮樂」的「學」,在概念思維的框架里出現僵化,從而使顯示宇宙萬物一體相通的「道」受「損」,即出現堵塞。現代人,其所以缺乏象思維,正是這種在概念思維框架中所顯示的「為學日益,為道日損」。從現代腦科學的意義上看,用《數字化生存》的作者尼葛洛龐蒂的話來說,就是只用左腦而使右腦萎縮。

但是人們卻沒有意識到這種右腦萎縮的可怕性,有些人反而指責別人對右腦的開發,對人的潛能挖掘,諸如:繪畫藝術又不是鬧著玩的,沒有雙眼是不可能畫畫的。

那麼我又是怎樣教盲人學畫畫的呢,概括而言:一聽,聽理念課樹立信心戰勝自己的弱點,聽用筆在紙上組成不同造型時的聲音特點,聽自然界美好的氛圍之聲,從而激發自己的創作衝動。二嗅,讓盲人學生嗅出不同五顏六色的味道,嗅出濃淡墨色的味道,嗅出一幅新國畫構圖的墨味布置和五顏六色的分布來。三比,拿著盲人的手當畫筆在畫紙上比畫著學構圖,在手掌心上練造型等等。四摸,摸我用硬紙剪出來的各種動物、植物的形狀及構圖等。五練,勤能補缺,用心苦練,早晨4—5點就起來靜心的用心聽毛筆在紙上造型時如春蠶吃葉的聲韻之味,並加以總結成為自己的心得。六評,我們老師再對盲人學生的國畫習作進行講評指導等。

特殊藝術中的盲人繪畫猶為特殊,盲人畫家嘉露蓮這樣說:我們行事為人,是憑著信念、信心,而不是憑著眼見。由於盲人失去了視力,他們認識色彩是憑著嗅覺和觸覺,他們深有體會的說:每一種色彩都有自己獨特的氣味。而且用手觸摸也會有不同的感覺。例如紅色使我的手指尖感到暖,而藍色則感到涼……。正因為他們不用視力去繪畫,所以她們的繪畫都不是寫實的,而是中國式的寫意畫,他們把用心去觀察到的事物憑藉著想像去創造,這就是特殊功能的繪畫藝術,是心靈的畫卷。正如印象派繪畫大師塞尚所講的:「藝術不是直接描繪,而是我心靈的作品」,這才充分體現了藝術挑戰精神的極限,只有這樣,繪畫才能治心明道,盲人才能從藝術中得到完美,所以盲人繪畫是特殊的,其創作的一般過程是這樣:她由一條嚮導狗帶領,拿著錄音機到風景區去散步,錄下水流,鳥鳴、風吹樹林、狗踏青草等聲響。回家後,反覆播放錄音帶,當這些感覺衝動使她得到一幅畫的意念和意象時,就要聚精會神,「發瘋似地畫起來」。她說:「我只是畫出我心中的畫,直到我的心感覺已經完成時為止」。盲人的畫就是這樣熱衷於表達心靈,表達內心的情緒,這些方面是複雜和潛在的,是非語言,非文字的,也就是說:繪畫藝術必須忠實於自己的感受,在表現自我感受的過程中不能照顧到誰,如把該照顧的都照顧完了,藝術家自身也就不存在了。是的,特殊藝術中的盲人繪畫正是按照「藝術上的突破,以思想上的突破居先。藝術上的變,以魂質上的升華更有價值。」去實踐的,當盲人畫家們在觀念上衝破繪畫一定要視覺的框架之後,就享受到了公民的權力,就明白了「等你逼近生命極限,把曾經想都不敢想的事也做過了,這就叫無憾的人生。」

John Bramblitt繪畫的方式與盲人閱讀的方式相同,通過觸摸紋理而感受。John Bramblitt通過使用一種特殊類型的油漆,在畫布上用線條創造屬於他的藝術品,他說,每種顏色顏料的手感不一樣,這樣調色是靠自己觸摸的感覺而決定。「有時候人們很難理解我是如何畫畫的,但這真的很簡單」他笑道「這需要耐心」。

在他的網站上他說:「我所作的基本上就是把所有能看見的畫家眼睛的工作用觸覺來代替。突起的線條讓你找到畫布上顏色的位置。」Bramblitt說失明對於他來說是生活的轉折點,因為他開始在最黑暗的洞穴中發現了出路,那就是藝術。他開始用速干顏料在畫布上畫出線條,將空白的畫布塗滿顏色。隨著他越畫越多,他發現每種顏色都有不同的質感。

神奇的盲人畫家和他的作品

神奇的盲人畫家和他的作品_趣聞趣事_中文幽默王

  你能相信這些彩色畫作是出自一位盲人畫家之手嗎?沒錯,他就是現年53歲的土耳其畫家Esref Armagan,一出生就失明的他,卻可以畫出人物、山水、房屋、蝴蝶等,甚至還繪製了自己的肖像畫,而且可以很好的應用色彩、陰影、透視比例等繪畫技巧,是不是很神奇?

佛家的「天眼說」或修鍊界所謂的「第三隻眼」。

佛家的「天眼」說

「天眼」真的存在嗎?_本來如此_新浪博客

大約二十多年前,科學家們一直認為人的神經細胞分工很細。比如,視覺細胞只接收處理眼睛傳來的信號,而聽覺細胞只是對聲音有反應。但後來研究人員發現神經細胞其實可以有多種功能。比如在靈長類動物的實驗中,一些細胞既可以對手的觸摸有反應,同時也可以「看」得見距離這隻手幾厘米內的物體。

和李教授合作進行特異功能研究的物理學家陳建德教授則是從佛家「開天眼」的說法來解釋。天眼在人的兩眉之間往上一點連結松果體這個位置上。陳教授認為用手識字,可能就是這隻「天眼」發揮的功能,也就是修鍊界所說的第三隻眼所起的作用。

在許多古老文明的神像、祭司的面具上,或印度的佛像,道家的神像上在額頭的部位都不約而同地刻畫者這一隻眼睛。古希臘哲學家將其稱之為「靈魂的寶座」。

史記「扁鵲列傳」中記錄著神醫扁鵲具有「視人五臟顏色」的能力。他具有天眼,能透視人體,然後配合自己的醫學知識,幫人「看」病。這個例子在俄羅斯也有,根據真理報2004年1月的報導,俄羅斯的一個小女孩娜塔莎可透視人體內部器官,看到其中有病的部位。

從小失明的盲人畫家艾斯萊福·阿馬甘(Esref Armagan)和其風景畫作。

著名「盲人繪畫」的實例

2005 年1月的《新科學家》雜誌報導了一個從小失明的盲人畫家艾斯萊福·阿馬甘(Esref Armagan)畫圖的事例。按理說他這輩子完全沒看過任何景象,然而他卻可以畫出山川、湖泊、房屋、人物和蝴蝶,對於色彩、陰影和透視比例的處理亦非常專業。

哈佛大學的神經學學者阿爾瓦羅·帕斯庫爾-勒奧納(Alvaro Pascual-Leone)邀請阿馬甘到美國波士頓接受測驗。勒奧納教授也請阿馬甘作畫,畫一條伸向遠方的路和路邊的電燈柱。盲眼畫家一手作畫,另一手指尖觸摸紙面完成作品。

在視覺功能缺失時,人大腦中負責視覺功能的區域並不會停止工作。而掃瞄阿馬甘的大腦時,發現在他作畫的時候,這一區域也發光,正像他「看」到了一樣。

勒奧納教授說,阿馬甘雖然沒有光感,但是他的「觀察」能力與正常人不相上下,他還能將反映到他大腦中的物體在紙上完整地表達出來。

科學家因此認為:爭論多年的關於人的意識眼(mind eye)應該是存在的,而且每個人都有,但是有正常視力的人所感知的外部信息太強,從而將這種能力淹沒了,阿馬甘卻得以發揮了這種能力。

有些學者認為人體有許多潛在能力尚未被開發出來,而這隻天眼其實就是人的本能之一。

================================================================


樓上已經提到過 Machine Learning Potential,用ab initio的計算結果擬合出足夠精確的力場。這種方法能夠成功的原因是找到合適的representation,在旋轉,平移,交換同種原子時保持不變,同時還可以求導(用於擬合原子間的力)。最近也有人用這類representation加上化學信息學中的 descriptor來擬合材料的性質。

還有用ML來擬合泛函的,Burke組,就是PBE中的B,發過幾篇PRL, PRB

還有個小應用感覺很有意思:通過NLP從文獻中獲取結構化的信息,省去了手動搭建模型的麻煩


其實就是把原先經驗/半經驗方法里用的統計模型換成機器學習里的模型了,80年代神經網路就已經在化學中進行了應用[1]。有經驗的化學家見的分子結構多了,見到一個新的分子結構就能推斷大致有什麼性質。各種統計模型就是把這個過程自動化了,但是在實驗室里可靠性往往還不如有經驗的化學家,因為各種計算模型把問題本身簡化了,真空中或者連續介質中的分子怎麼都和燒杯里的分子不一樣。像google這種用密度泛函理論(DFT)數據作為訓練數據搞出來的東西[2],除了說明密度泛函理論本身是self-consistent的,沒有任何意義。

對於量子化學方法,可以把機器學習的統計模型和量子化學模型對比一下:兩者都是用大量簡單的函數(比如高斯函數)去擬合一個複雜的函數,都是用一個標準來判定擬合的有效性(變分原理或者error value),用某個方法(比如梯度下降)去尋找更好擬合,都需要人工介入各種調參數。說起來神經網路CNN之類模型的複雜程度還不一定比得上化學裡的ab initio方法。

[1] http://web.uni-plovdiv.bg/plamenpenchev/mag/files/ang_chem2.pdf

[2] https://arxiv.org/pdf/1702.05532.pdf


phd,正在做這方面的,給幾個關鍵詞吧,材料信息學,材料設計,材料基因組,化學信息學。其實大多方法用的方式藥物設計,藥物篩選那一套,演算法之類的機器學習領域已經很成熟了,所以材料信息學這塊數據收集整理顯得尤其重要。無機材料這塊結合密度泛函已經發展的相對成熟了,有不少好工作,特別厲害催化劑設計這塊。高分子這塊,哈佛大學的清潔能源項目發了不少好文章。另外,機器學習結合分子動力學模擬也有不少人弄過。可以說機器學習已經滲透到了化學的各個角落。

說到底,個人覺得,數據積累,收集整理才是核心,方法顯得不是那麼重要。

手機打字就不貼文獻啥的了,權當科普,謝謝閱讀!


安心轉專業,別想太多


去年「邏輯思維」舉辦的跨年演講中,羅振宇在分析人工智慧時,曾提出了一個很重要的論點:人工智慧不僅是人的延伸,它還是人的替代

所以在探索自然科學與人工智慧技術結合有什麼樣的研究方向時,我們不妨關注一下目前自然科學研究中「有哪些工作還需要人力花費大量的精力完成」,但其實這些工作可以由人工智慧完成,而且更省時省力,效果也更好。

在這方面,美國科學家、CRIXlabs 創始人 Shalini Ananda 是個很好的例子,將 AI 技術應用於實驗室研究中,取得了不俗的成果。


以下是 Shalini Ananda 在博客上分享的研究歷程:

我們都知道 Google、Facebook 等科技巨頭爭相研發人工智慧技術,推出了很多改變我們生活的產品。但是我想,這些技術在除了科技之外的方面,比如化妝品,能否產生同樣的革命性效果?

於是我(Shalini Ananda——譯者注)開始琢磨在這個AI技術風起雲湧的時代,我們是不是可以將它們應用在自然科學領域,比如化學研究。

在實驗室做試驗其實是一件勞動密集型的工作。不太適合經不起折騰和挫折的人。我讀博士期間,在實驗室里不知道有多少次看見我的同學因為心理壓力把試驗搞砸了。幾乎有90%的試驗是因為之前的操作結果發生了很小的緩慢變化而失敗,所以實驗人員要浪費大量的時間和資源才能獲得相關的經驗。

在2013年的時候,有關機械方面的計算化學領域就開始採用一些計算機模型來檢測人體對化學製品的反應狀況。但是在實驗過程中,這些電腦模擬工具並沒有在實驗過程中給研究人員帶來多大的幫助。研究人員需要將觀察到的數據與多種實驗條件擬合。不幸的是,並沒有一個標準的公式可以參照。如果擬合完一種實驗條件,你需要一組新的演算法去擬合另一種實驗條件。

當時,AI 正迅速應用於技術和金融領域,但自然科學領域卻鮮有應用。我可不能眼睜睜看著機器學習等先進技術沒有應用到那些急需提高效率的領域。所以讀完博士以後,我開始研究怎樣利用人工智慧技術為人體製造新材料。我知道,比起工程師手工為人體的各個方面建模,機器學習能更高效地處理人體生物與化學系統之間的複雜性。

第一步就是先給肝臟、大腦、脾臟和肺部器官各自建立一個資料庫,研究它們和之前測試的各種材料是如何相互作用的。通過建立線性模型和經驗模型,我就能改變構建機器學習系統所需的特徵。構建好機器學習系統後,我採用了支持向量機(Support Vector Machine)測試這些特徵和模型。這種方法的準確度很高,所以我決定再深入研究。

為了讓特徵工程和資料庫的能力最大化,我用深度學習技術使它們一般化,能在更大範圍內運行。這可能是深度學習技術首次應用在自然科學學科上。等模型結果符合預期結果後,我們開始實地測試。經多次討論後,我用了152個資料庫測試我們的演算法,這些資料庫都是關於納米粒子怎樣滲入活體中的動物器官組織。

說實話,皮膚科學令我很著迷。我開始研究這一領域中計算技術現在都有哪些局限性,然後發現人們很難預測皮膚中活性物被應用後的生物利用度。在和很多研究者溝通後,我發現他們都遇到了同樣問題:為了確定皮膚中活性物的濃度,人們不得不花費大量精力做很多次實驗

然後我和這些研究者合作,用一種叫做對苯二酚的化合物測試我們的演算法。測試結果顯示,演算法對化合物濃度的預測和實驗人員做完一系列實驗後的結果相比,正確率高達97%。後來我們又用演算法對其它實驗項目進行了測試,結果也非常令人滿意。總之,演算法可以達到如此高的準確率,花費的時間卻是傳統方式的極小一部分,這給研究人員留下了深刻印象。

我想說的是,AI技術對於生物學及化學研究的進步能夠發揮極其重要的作用,而且能夠實現商業應用。利用AI技術分析人體化學實驗信息,能讓研究人員清楚地知道每個人體的特殊機理,我們從而能創造未來人類所需的產品和治療方法。


其實近年來,即便是像化學合成這樣傳統的實驗室工作也與「大數據」和「人工智慧」越走越近,甚至出現了不少交集。

比如2016年波蘭科學院教授 Bartosz Grzybowski 就發表了一篇關於「通過計算機輔助設計分子合成」的論文(鏈接見末尾),系統總結了該領域的理論基礎和近年來的研究進展。波蘭和韓國兩國的科學家還聯合開發了一款名為 Chematica 的軟體,可以幫助化學家快速得到物質的合成路線。Chematica 運轉建立在」深度學習「基礎上,可以在短時間內預測反應,甚至提供未被文獻報道的分子合成途徑。

此外,全球著名的學術出版商 Wiley 也開發了一款建立在「大數據」和「機器學習」基礎上的化學合成軟體 Chemplanner,可以通過雲計算幫助化學家在多種合成路徑當中篩選出簡潔高效的最優方法,也可以利用精選的合成規則預測反應路線圖,完成從目標產物到可獲取的起始原料間的逆合成分析。

傳統的有機化學合成研究需要耗費大量的成本和實驗人員的精力,而且對合成路線設計人員的記憶能力與分析能力都有很高的要求。人工智慧技術的引入也許能為有機化學合成領域帶來一場革命。

參考資料:

https://www.linkedin.com/pulse/ai-future-computational-chemistry-shalini-ananda

波蘭科學家論文鏈接:

http://onlinelibrary.wiley.com/doi/10.1002/anie.201506101/full

拓展閱讀:

遍地開花的AI助手,代表著人機交互方式的未來

以彼之道,還施彼身——使用機器學習來揪出作弊的玩家

不是人工智慧,是智能機器

官方微博:@景略集智

微信公眾號:jizhi-im

商務合作: @軍師

投稿轉載:kexiyang@jizhi.im

集智QQ群:557373801


更新一下,最近做的一個高維神經網路,可以準確的跑出勢能面,將結構坐標和種類導入,根據對稱函數就可以得到對應的能量,雖然只是重複造輪子,但是對我後續的工作有點幫助,別人文章寫的很亂,代碼根本沒有。

————————————————————————

美帝 Hongliang Xin 神經網路篩選二氧化碳還原催化劑

斯坦福 Norskov 好像主要是卡梅倫大學一個老師(在他課題組做過博後),剛剛發過一篇nature chemistry,尋找複雜反應網路的決速步驟

美帝郭華,用神經網路尋找勢能面的

最近看到一個印度的文章發在cm,看完了再來補充

感覺國內做這個比較少,可能是化學的學生計算機接觸少,接觸的都轉行了。


轉個自己類似問題下的回答

合成分析、反應預測、性質預測、結果分析、流程式控制制(如化工的專家系統)。目前主要是傳統的神經網路和專家系統,而且對於化工來說專家系統運作得很好,新的人工智慧方法要改變有難度。

近期已經有應用深度學習方法的文章了,我預測可見的未來里大部分化學裡的天賦和歸納知識都會敗給深度學習。

有點期待坐擁大量數據的reaxys和scifinder干點什麼,預測反應,規劃反應,直接生成操作步驟我想都只是訓練下的事了。

我自己在做手寫化學式ocr和自動核磁譜解讀的玩具。


搜chemometrics.化學大數據結合machine learning已經很多人做過了,和ann等各種結合也十分常見。


據說有個project 還是什麼的研究了通過大量輸入歷史文獻然後通過深度學習預測一個新反應的產物還是什麼之類的………具體未考證

---------------------------------------

剛隨手搜了下,現在有文可考的應用方向似乎主要集中在關於藥物 quantitative structure activity/property relationship (QSAR/QSPR)方面的預測. 具體本人在非相關領域,就不多說了,希望相關領域大牛趕緊來多介紹介紹


化學計量學啊,少年


Cheminformatics/Bioinformatics? 我並沒有Cheminformatics的背景,假如考慮後者的話,很多很多。不知道可不可以隨意設想一個題目,例如genetic algorithm可以給小分子建庫。或者分子結構本身可以建立資料庫,然後各種ML/Big Data的技術去挖庫就是一個很典型的利用了。

再舉個例, multi-agent system和普通的robotics結合,應該可以提高實驗室的自動化程度。獻醜了。


推薦閱讀:

如何看待《中國青年報》文章「我國基礎科學研究論文數量翻番」所描述的形勢?
為什麼計算化學領域研究者大多傾向於跟實驗組合作,對偏理論或者偏方法方面的工作不太受重視?
如何看待博士後留校當教授的人生軌跡?
作為農業類碩士,下地幹活難以避免,怎樣平衡科研中腦力勞動與體力勞動的比例,來體現一名研究生該有的價值?
做科研是經驗重要還是想像力重要?

TAG:人工智慧 | 科研 | 化學 | 神經網路 | 深度學習DeepLearning |