如何理解OF-DFT(Orbital-Free Density Functional Theory)?

因為以前做的大部分都是用現成的軟體算一些光催化,沒有做過方法的研究,

以後可能要做金屬納米團簇。Emily Carter組在JCTC有一篇用OF-DFT算了很大的體系,1,024,000個鋰原子。

感覺直接又對計算體系的數字有一個新認識了。

請問 為什麼OF-DFT這麼厲害?

它跟其他的泛函差別在哪?

對於一個剛入門的,從《A Chemist"s Guide to DFT》到理解OF-DFT還有多少技能點要加?


想搞清楚OFDFT說簡單也簡單,說難也難。筆者談談自身體會。首先,Orbital-Free Density Functional Theory (OFDFT)和Kohn-Sham DFT (KSDFT)都是屬於密度泛函理論(Density Functional Theory,簡稱DFT)家族的,只是前者研究的圈子較小,名氣遠不如KSDFT,但是近年來也有越來越多的組開始關注OFDFT。究其原因,還是因為OFDFT快,而KSDFT相對慢很多。

首先OFDFT和KSDFT的哈密頓量很相似,分成五部分:動能,外勢,Hartree勢,交換相關能,離子離子相互作用。實際上OFDFT和KSDFT只有第一部分動能的處理不一樣,其它四部分基本是和KSDFT一模一樣的求解演算法。 在動能項的處理上,KSDFT是把系統的全套佔據波函數都算出來,而波函數要滿足正交歸一的性質,這就是一個傳統演算法需要N的3次方耗時的步驟,其中N是原子數。可以想像,如果KSDFT能夠一天處理一個100個原子的系統,那麼同樣的計算資源處理1000個原子的系統就是需要1000天(兩年多。。)。OFDFT用的是一個動能泛函來得到系統電子的動能,撇棄了波函數的使用同時也省去了正交歸一化系統波函數的步驟。這樣得到的一個直接結果就是『快』,非常非常的快,相應的演算法也可以變成O(Nlog(N))的速度,是一個計算量隨系統大小準線性增加的一個演算法。

實際上上面說的『快』,也是有限制的。例如剛提到的O(Nlog(N))就出自於快速傅里葉變換(Fast Fourier Transform,簡稱FFT),在採用平面波基矢量構建的DFT軟體包里起著舉足輕重的作用(Carter組的OFDFT也是用平面波做的)。近年來,摩爾定律的失效使得政府企業開始投身於超大規模並行計算,一個計算任務動不動就可以跑上幾萬個核已經不是新鮮事。而事實是FFT最多並行到一兩千個CPU核效率就不行了(因為核之間通信也要浪費時間)。KSDFT這十幾年來在超大規模並行上投入也不少,很多組在做(例如英國的CONQUEST,美國的QBOX等),成果就是號稱KSDFT也能算到幾萬個原子。OFDFT在這方面的發展相形見絀,其中一個原因就是受限於FFT無法進行超大規模計算。16年這篇JCTC就是採用了一個新演算法,拋開了FFT的通訊限制,使得OFDFT軟體可以跑上幾萬個核而同時還擁有不錯的並行效率。

另外,算1百萬個原子對於OFDFT來說並不是新鮮事,早在09年Carter組就算過1百萬個原子,當時跑了五個多小時得到了收斂的電子密度。16年這篇JCTC的貢獻在於可以在極快的時間(1分鐘左右)得到1百萬個原子的收斂電子密度,當然前提是有很多很多的計算資源可以燒(六萬多核)。可以想像,一個快速得到電子密度的演算法對於實際應用(例如題主提到的團簇)所需要的離子結構優化或者分子動力學都是極其重要的。


謝邀 @raito liu

關於 OF-DFT 為什麼快,@科學雜役 師兄已經說得很詳細了。我從電子結構的角度補充一下這背後的 motivation,也即為什麼人們想發展 orbital-free 的 DFT,為什麼這樣做是合理的 etc.

首先說一個事實:在最初的 DFT 理論中,是沒有 orbital 的概念的。也即 DFT 本來就應該是一套 orbital-free 的理論。Hohenberg-Kohn 第一定理(HK-I)說:體系的電子能量只是電子密度的泛函,也即:E equiv E[
ho],不依賴於其他變數。這個結果是令人震驚的,因為如果按照傳統的量子力學的表述,能量是哈密頓量在波函數下的期望值,也即

E equiv langlePsi|hat{H}|Psi
angle = E[Psi]

能量應該是波函數的泛函,而非電子密度。所以 HK-I 使得我們描述系統所需的自由度3N 減少到 3(即便考慮 hat{H} 只含有單體和二體算符,能量可以被簡化為單、雙粒子密度矩陣的泛函,自由度還是遠高於電子密度)。

雖然許諾了一個美好的前景,但關於 E[
ho] 長什麼樣 HK-I 毛都沒說。為了得到它的具體形式,一般作如下分解:

E[
ho] = T[
ho] + V_{	extrm{ee}}[
ho] + V_{	extrm{ext}}[
ho]

分別對應:1、電子動能,2、電子-電子(ee)相互作用能和 3、電子在外場(ext)中的能量。其中最後一項是 trivial 的:

V_{	extrm{ext}}[
ho] = intmathrm{d}^{3}m{r},v_{	extrm{ext}}(m{r})
ho(m{r})

即電子密度 
ho(m{r}) 在外勢場 v_{	extrm{ext}}(m{r}) 存在下的積分。前兩項都沒有已知的解析表達式,故而需要近似

先說電子-電子相互作用 V_{	extrm{ee}}[
ho]. 一個合理的近似是經典庫倫能

J[
ho] = intmathrm{d}^3m{r}_1intmathrm{d}^3m{r}_2,
ho(m{r}_1)
ho(m{r}_2)r_{12}^{-1}

但可惜的是 J[
ho] 沒有包括電子作為量子全同粒子(費米子)的交換和關聯作用(以及有自作用誤差,不過這是另一個 story 了)。儘管如此,J[
ho]不失為一個好的近似

再說電子動能 T[
ho],這才是最讓人頭痛的。精確的電子動能的形式我們是知道的,也即波函數那套理論:

T[
ho] = langlePsi|hat{T}|Psi
angle

但這並無卵用。。。因為這不是 
ho 的泛函而是 Psi 的泛函。而前面說了,一旦牽扯到波函數 Psi,DFT 在「自由度少」這一點上的優勢就不太能體現出來了。

為了把動能寫成 
ho 的泛函,很多人做了嘗試,我說一下比較主流的發展過程:

  1. Thomas-Fermi (TF) model:

從均勻電子氣出發可以導出

T_{	extrm{TF}}[
ho] = C_{	extrm{TF}}intmathrm{d}^3m{r},
ho^{5/3}(m{r}),qquad{}C_{	extrm{TF}} = frac{3}{10}(3pi^2)^{2/3}

你可以想見這泛函算起來很快(因為形式簡單到爆炸),但很不幸的是實際體系並不能看作均勻電子氣,尤其是有限體系(如分子和你說的 cluster),所以對它們的描述並不好。用它來計算分子甚至不能成鍵

2. Thomas-Fermi-Dirac (TFD) model:

和 TF 幾乎相同,只是增加了交換項(電子是全同費米子):

T_{	extrm{TFD}}[
ho] = T_{	extrm{TF}}[
ho] - C_{	extrm{x}} intmathrm{d}^3m{r},
ho^{4/3}(m{r}),qquad{}C_{	extrm{x}} = frac{3}{4}igg(frac{3}{pi}igg)^{1/3}

要是我,我肯定賭 TFD 比 TF 更好,原因很簡單-它包含了更多的物理。最早寫下這個 model 的人絕壁也是這麼想的。可惜打臉的是,分子體系計算得到的結果 TFD 更差。。。這類情況的原因一般都是:新加入的(有更多物理意義的)項破壞了原來模型的「誤差抵消」作用,所以更差了。類似的例子還有 GGA 相比 LDA 加入了電子密度的梯度信息,本應該完爆後者,但在描述某些性質時反而不如 LDA。。。

3. Thomas-Fermi-Dirac-Weizsacker (TFDW) model:

你應該已經看出規律了。。。每次加個人名,泛函里就多一項,所以:

T_{	extrm{TFDW}}[
ho] = T_{	extrm{TFD}}[
ho] + frac{lambda}{8}intmathrm{d}^3m{r},frac{|
abla{
ho(m{r})}|^2}{
ho(m{r})}

TFDW 相比前兩個更複雜了——不僅有密度本身,還有密度的梯度(
abla
ho(m{r})),因此相比於 TFD,它更能描述實際系統中電子密度的非均勻性。lambda 是常數,理論上可證明為 1/9,但數值結果發現 1/5 效果最好(理由:誤差抵消。。。)。

聰明的你肯定已經猜到這是某種「Taylor 展開」得到的。實際上它叫電子密度的 conventional gradient expansion. 這裡新加入的是這個 expansion 的二階項(TF 是零階)。可以證明,所有奇數階都為零,所以下一個非零貢獻是四階,之後是六階,etc.

到此該話題本應完結——我們有了一個 hierachy,只要一直計算到更高階的項,總可以達到理想的準確度,完美!但事實是殘酷的:一方面,從四階開始公式變得很複雜,而且對能量的修正非常小。另一方面,也是更加讓人失望的是,從六階開始,後面的項對分子體系都是發散的!

說出來你可能不信,TFDW model 是上世紀 30 年代人們就得到了的。彼時量子力學建立還只有十多年,離 HK 的文章發出來還有三十來年。可見人們對「用電子密度來描述體系」的信念是多麼早就有了的。歸根結底,上面的方法在早期沒有應用,就是這些動能泛函都不夠好。為什麼對動能的描述如此重要?答案需要強調三遍:

因為動能和總能量是一個數量級的

因為動能和總能量是一個數量級的

因為動能和總能量是一個數量級的

所以動能有一點小的相對誤差,對體系總能量估計的偏誤就不可容忍了。所以我個人感覺是,在 DFT 的發展中,對動能泛函的尋找一隻是個大問題。找到好的動能泛函幾乎就是找到了新一代 DFT.

KS-DFT 能火到今天,自然也不例外。前面的一些嘗試都試圖去構造 T[
ho] 的顯性形式,其難度是可以想見的——構造一個函數都很難,更何況是一個泛函?所以 Kohn 和 Sham 提出另一種思路,回到波函數理論,像 Hartree-Fock 一樣,引入大家熟悉的「軌道」的概念,把動能寫成每個軌道的動能求和

T_{	extrm{KS}}[
ho] = sum_{i = 1}^{N}intmathrm{d}^3m{r},-frac{1}{2}phi^{*}_i(m{r})
abla^2phi_i(m{r})

雖然這公式里沒有 
ho,但它仍然是密度的泛函,因為密度和這些軌道有關:


ho(m{r}) = sum_{i = 1}^{N} |phi(m{r})|^2

這麼說雖然非常流氓,但也沒啥錯。。。

那既然動能的近似有了,電子-電子相互作用的近似也有了,總能量就可以重新寫一下了

egin{split}
E[
ho] = T[
ho] + V_{	extrm{ee}}[
ho] + V_{	extrm{ext}}[
ho]  \
= T_{	extrm{KS}}[
ho] + J[
ho] + V_{	extrm{ext}}[
ho] + V_{	extrm{xc}}[
ho]
end{split}

可以看到,我們

  1. 用 KS 動能 T_{	extrm{KS}}[
ho] 代替了精確的動能泛函,
  2. 用經典庫倫能 J[
ho] 代替了精確的電子-電子相互作用。

這當然會帶來誤差(V_{	extrm{xc}}[
ho]),所以我們給誤差起個名字,叫「交換-關聯能」。所以現在矛盾被轉移了:之前大家集中精力於怎麼近似動能,現在變成怎麼近似交換-關聯能

可能初看你會覺得這不是玩文字遊戲么。。。還不是要近似。但 KS 理論牛逼的地方在於,T_{	extrm{KS}}[
ho] 對於動能的近似非常好。所以

剩下的 V_{	extrm{xc}}[
ho] 比總能量小一到兩個數量級

剩下的 V_{	extrm{xc}}[
ho] 比總能量小一到兩個數量級

剩下的 V_{	extrm{xc}}[
ho] 比總能量小一到兩個數量級

我又強調了三遍,因為這是 KS-DFT 成功的關鍵:雖然由於引入軌道T_{	extrm{KS}}[
ho]的計算代價明顯大了但是因為準這個 trade off 是值得的

==================================

到此,我相信

  1. 你已經能理解什麼是 orbital-free/orbital-dependent:關鍵差別在於動能泛函。
  2. 大多數 DFT 的分支版本成功的關鍵也是找到了好的動能泛函(如 KS-DFT)。

  3. orbital-free 不是什麼新概念,上世紀 2、30 年代就有了。
  4. 近些年又火起來了,理論方面的原因也肯定只有一個:

找到了新的、好用的動能泛函

找到了新的、好用的動能泛函

找到了新的、好用的動能泛函

當然,硬體、演算法和其他方面也有原因,師兄 @科學雜役 已經講得很詳細了,我就不贅述了(我也不在行。。。)。


戰略性mark,此處應邀請 @科學雜役 ,為老闆長臉的機會來了,您先請。


樓上幾位解答已經非常棒了。添一點新時代的小故事。在加州有一套機器學習的workshop ,好像是每年搞,攢了數學計算機物理的人,第一屆就搞出了機器學習動能泛函。看來OFDFT以後要有大發展了。

DFT理論完全不能看Chemists" guide,我看完一遍以後還是不懂,而且書里對於為啥KS orbital 無物理意義,許多文章還拿來討論也沒有解釋!我是問了劉文劍和Bickelhaupt才有點感覺。Parr和Yang的書入門非常好,還有一本EKU Gross的偏物理一點。偏固體的DFT的好書較多:Kaxiras的固體的原子與電子結構、Martin的電子結構;還有R Hoffman的徒弟Dronskowski也有一本講COHP的書值得參考。


團簇的話我懷疑cluster不是很大的時候orbital可能會localize,kinetic energy functional可能會有問題。其實我感覺在 cluster boundary的地方都會有問題。不過純屬猜測


推薦閱讀:

數學在化學中的有何應用?
如何評價Google使用量子計算機在量子化學計算領域取得的最新成果?
如何評價哈佛大學化學與化學生物學系的George M. Whitesides教授?
日本核泄漏會導致海水污染,以後的海鹽都不能吃了嗎?
一定水面上泡沫破裂速度為什麼越來越慢?

TAG:化學 | 凝聚態物理 | 理論化學 | 計算化學 |