機器學習在凝聚態(多體、強關聯)的研究現狀如何?

物理專業本科生想了解一下機器學習在凝聚態(多體、強關聯)的研究現狀。

希望各位能指點一下。(由於剛接觸,望通俗易懂地講一下)

最近在看一篇文章:Triangular Quantum Loop Topography for Machine Learning

https://arxiv.org/pdf/1611.01518v1.pdf

機器學習相對於之前傳統判斷拓撲量子相變有什麼不同?

ps:看了一遍文獻,有很多不解,第一就是關於如何獲得訓練數據的問題;

第二就是本文在對於chern拓撲絕緣體和分數chern拓撲絕緣體相變點的判定上不上很理解(為什麼chern拓撲絕緣體的相變點以p=0.5為界,而分數chern拓撲絕緣體以p=0.01為界?);

第三就是這個機器學習的方法到底有什麼優勢?


作者:張旦波

鏈接:知乎專欄

來源:知乎

著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。

一些文獻閱讀筆記, 關於機器學習和凝聚態物理中的物態的交叉點

  • 用物理的方式去研究機器學習里的問題
    • [1410.3831] An exact mapping between the Variational Renormalization Group and Deep Learning
      • 該文章把物理里的重要概念重整化和深度學習結合聯繫起來了.二者在思路上的共同點是能對原始數據通過粗粒化處理,去除噪音,找到更好的特徵.文章里提到的restricted Boltzmann Machines,在Hilton的深度學習的經典文章deep belief network里也是核心.我對該文章的質疑是它定義的重整化不能讓我信服.另外,從概念上講,重整化不應該是非監督學習,畢竟需要考慮系統的哈密頓量. 
    • [1605.05775] Supervised Learning with Quantum-Inspired Tensor Networks
      • 核心是把MNIST數據集里的手寫數字的每一個像素當作自旋疊加態,然後把數據組織成tensor product的形式,尋找的weighting是matrix product state.確實像聽起來的那麼複雜,畢竟用到的tensor network是當前凝聚態物理研究中的相當前沿而且重要的工具.該方法把關鍵的信息存在連接上,在學習的過程中需要反覆掃描,在各連接上通過SVD進行優化.目前在MNIST數據集上的結果還不錯.特別的數據組織方式+SVD,可能是該方法有潛力的地方. 
  • 用機器學習去研究物理問題
    • [1606.00318] Discovering Phase Transitions with Unsupervised Learning
      • 假如我們是數據科學家但完全不懂物理,怎麼去研究物態問題呢?這篇文章給出了個很好的例子.對於鐵磁(Ising型,自旋只能朝上或者朝下),在不同溫度下的構型,可以用高維向量來表示,維度為d=N(N為總格點數). 這些構型有什麼不同呢? 最簡單的思路就是做降維處理.通過PCA做降維(d=2),發現數據分為三堆.高溫下的數據集中在0點附近,低溫下的數據聚集在兩邊,而且對稱.進一步可以發現x維的數據是投影在[1,1,1,...1]上形成的,即為所有格點上自旋求平均.從物理上來講,這個投影即是求序參量的過程.而數據的二重對稱分布,正好對應自發對稱破缺.
      • 推而廣之,或許可以單獨開創純粹用數據科學的視角來做物理的風格,即避免引入物理的框架.一般來講,主要是用無監督學習的方式.後面提到的監督學習,label一般都是在物理的框架下定的.雖然監督式學習在物理中也有意義,但更像是高級版的數據處理而已.沿著data science without physics的風格,我嘗試了下2016年諾獎里的KT相變,發現問題沒想像的那麼簡單.PCA失去了效果,因為這時線性的做法已經區分不了相變點兩邊的相了.這裡需要一種降維,能提煉出構型里的關聯的特徵.或許時間序列裡面的一些降維演算法能有效.   

    • [1606.02318] Solving the Quantum Many-Body Problem with Artificial Neural Networks

      • 主要把維度很高的波函數編碼神經網路的結構里,再去計算哈密頓量的能量等.對於一些有精確解的模型,如cluster模型,編碼的問題已經有了解析解.[1609.09060] Exact Machine Learning Topological States. 
      • 該方法潛力未知,斗膽想下,有沒有可能成為tensor network的潛在競爭對手.從數據的組織方式來看,tensor network是把局部的信息連接起來,而ANN則能連接全局的信息;從優化演算法來看,前者的威力在於可分散式的隨機梯度演算法,而後者的威力在於可以採用強力去除不相關噪音的SVM.tensor network已經在研究拓撲態里得到很廣的應用,如果採用ANN的方式,如何去理解拓撲態里的糾纏,應該是個很關鍵的問題.
    • [1605.01735] Machine learning phases of matter

      • 給我5個參數,我就能擬合一隻大象.鑒於神經網路的表達能力,用它能識別物態構型里的不同結構,不管是經典的朗道序參量,還是XY模型的power law關聯的,還是拓撲序,把神經網路做大做強,都一網打盡. 但是這又有什麼用呢? 港真這麼無腦暴力是物理最鄙視的了。


利用機器學習來研究DFT的基礎理論

  1. Pure density functional for strong correlation and the thermodynamic limit from machine learning
  2. Understanding machine‐learned density functionals


哈,身處中科院物理所。辦公室在m樓三樓,七樓就是理論組的大本營。前不久他們剛剛舉辦了機器學習與多體物理的研討會,有興趣可去物理所主頁找名字然後看他們的文章。

///------------------------------------------------------------------------------------------------------------

機器學習與多體物理 這是物理所主頁給的網址,可以下載報告人的演示文檔

不好意思啊,問過老師了。由於涉及未公開發表的成果,暫時不能給密碼。感興趣的同學可以關注幾位老師近期的工作。不好意思,讓大家失望了。

///------------------------------------------------------------------------------------------------------------

勉強回答下第一個和第三個問題吧。第一個我也問過在理論組的同學,他的意思就是我們現在其實已經是有計算方法和指標(DFT)來判斷一個物質是不是拓撲絕緣體,然後實驗驗證之後,該物質的各種參數以及實驗結果就可以作為訓練集的一條記錄啦。

但是量子體系的模擬是很耗時間的,想想為什麼花大力氣發展量子計算機,或許機器學習可以直接從外部特徵做出判斷從而減少計算時間吧。


我之前也幻想著機器學習能幫助實驗工作者做一些預測工作,比如通過已知材料的超導性質預測可能的新的高溫超導體,不過查了幾篇文章發現都是理論工作者在做一些我完全看不懂的東西。所以,機器學習在凝聚態(實驗)裡面應用還是比較有限,不排除利用機器學習的方法是為了吸引眼球。當然這只是一隻實驗狗的一家之言。


拓撲量子很新的話題?高深


推薦閱讀:

需要做聚類、分類、時間序列分析,用什麼工具比較好?
本科生沒讀研怎麼讓自己機器學習水平更近一步?
數字圖像處理/計算機視覺的進階問題?
L1範數的最優化過程是怎麼樣的?梯度下降遇到不可導點怎麼辦?
如何才能看得懂變分貝葉斯方法(Variational Bayesian)?

TAG:機器學習 | 理論物理 | 量子物理 | 量子多體理論 |