如何向非物理專業的同學解釋重整化群?


想像一下你是一個973首席科學家,你的課題是用一個牛逼閃閃超級計算機模擬一杯水,看看在裡面慢慢拽鐵球阻力有多大。你的想法很簡單:直接精確模擬每個水分子!

你給電腦里輸入了水分子的真實大小(一個參數),形狀(比如說用了2000個參數描述)和不同距離的作用力(又用了2000個參數),你的超級計算機很牛,直接模擬了10^26個水分子。然後你把鐵球也建了模放了進去,用計算模擬的方法算出了讓鐵球慢慢前進需要克服的阻力。和實驗一比,發現精確吻合!好開心,只要再模擬幾回,多攢點數據就可以發nature了!

這時系統管理員給你發email,說你佔了太多的cpu時間,別人啥事都幹不了。讓你想辦法把計算量減少一點。

怎麼辦呢?你想了想,覺得鐵球這麼大,你不用把模擬搞得這麼精細也能得到正確答案。所以你決定把模擬用的水分子體積加10倍,這樣就只要模擬10^25個分子了。但是光這樣搞不行,得出的結果肯定不對,因為有些納米級的小運動造成的宏觀效果沒了。這時你有一個學生說,老闆,其實咱可以試著改改另外那4000個參數,說不定能把失去的東西給補償回來。你覺得靠譜,開動聰明的大腦想了想,心算出了每個參數需要的改變。於是你用更大的分子和新的參數重新計算,精確的再現了之前得到的數據。(注意,這時你已經對你的系統進行了一次 renormalization

系統管理員覺得你好欺負,又要求你降低佔用的資源。

你大手一揮說「這簡單,我能把cpu時間降到1/10000000000」,你就把剛才那個增大分子尺寸+調整參數的過程重複了10遍,現在你的分子體積比真實水分子大10^11次方倍,但是你仍然牛逼的算出了和實驗精確相符的阻力

在你的nature 文章里,把為了簡化計算髮明的這個方法叫Renormalization group (RG)。把每次模擬時水分子的大小叫做RG scale, 然後你把每次用的參數按照水分子的大小列了個表,把它們在尺寸增加時的變化,叫做參數的RG running。你把用這種方法得到的這個新模型,叫做low energy effective theory (EFT).

最後,你有點驚訝的發現,當你一步步增大水分子尺寸時,本來都很關鍵的4000個參數,有些乾脆變成0了,有些參數和其它的參數成正比了。總之到最後,你只用了大概10個自由參數就完美的描述了這一杯水。你把那些最後沒用的參數叫irrelevant parameters,把它們描述的形狀/作用力叫irrelevant operator. 你把這些irrelevant parameter/operator 都去掉,得到的那個精簡的理論模型就叫做renormalizable theory。它和你之前得到的EFT幾乎是一樣的。

這時,系統管理員又來欺負你,說你能不能就模擬兩個水分子,這樣他就可以用超算玩遊戲了。但是這回你兩手一攤,說哥們這真不行,如果我的水分子選的比我的鐵球還大,那無論怎麼調參數,我的計算肯定失敗,下一篇science就發不出來了!(在水分子的例子里,RG scale不應當接近鐵球的尺寸,在真正的場論里,有技術可以允許把RG scale選擇的和物理過程的尺寸相當。但是在任何情況下,RG scale都不應該比物理過程的尺寸更長。

而且,重整化了很多次之後,似乎你得到的這個的系統越來越不像一個個水分子。那它像什麼呢?你發現剩下的那幾個參數里,其中一個的計算值和實驗測出來的密度一樣,其中一個和溫度一樣,另一個和壓強一樣,等等。也就是說這個系統經過了多次重整化之後變得更像一杯連續流體而不是很多小分子。這個現象也非常普遍,因為自然界中不同尺度的現象本來就是很不一樣的。你於是在文章中指出重整化可以用來研究不同尺度的規律之間的聯繫和轉變。

-------

吐個槽,「重整化群」真是物理名詞界的一朵奇葩,把一個本來平易近人的詞翻譯的不明覺厲。這個詞英文是 renormalization group(RG). Normalize 大家都認得,基本意思是給一個變數乘個常數,讓它更符合一些簡單要求。比如幾何里說 normalized vector, 就是說改變了一個矢量的定義,讓它的長度等於一. re-normalize 就是不斷的 normalize. group 這裡是泛指變換,不指數學上嚴格的群。renormalization group 的字面意思就是「不斷重新定義參數的一組變換」。

-------

警告!前方有大量物理名詞出沒!!

重整化群在物理中有很多深遠的影響。標準模型是我們描述粒子物理的基本理論,它是一個renormalizable theory. 從RG的角度看,它就相當於我們在上面把尺度擴大的10^10得到的effective theory。也就是說,真正的基本理論埋藏在比標準模型小的多的尺度。標準模型的尺度是多少呢?是10^-18米。所以終極理論描述的過程要比這個還小的多。我們離終極理論還很遠很遠。

現在想像,如果你的計算機無限強大,你能模擬無限大的一杯水。(現在不考慮鐵球了)你不斷的重複上面的這個RG過程,最後會怎麼樣呢?很可能,最後當你增大分子體積的時候,你發現系統的所有參數都不再需要變化了!這時,你就說你的系統有了scale symmetry,尺度不變性。你把這個尺度不變的模型叫一個不動點。後來你發現,可以亂改最初的那個精確分子模型的參數,但大部分情況下,經過很多輪RG running,它還是跑到了同一個不動點。你就說所有這樣的微觀理論都屬於同一個universality class. 有時系統也會跑到另一個不動點。所以你發現RG對輸入的微觀系統實現了一個分類。這個和機器學習很像。(如何理解「深度學習和重整化群可以建立嚴格映射」,這一結論對領域有何影響? - 物理學) 兩個非常不一樣的系統宏觀上行為可以是完全相似的(屬於同一個universality class)。比如在三相點的水,和在相變臨界態的鐵磁體就可能屬於同一個universality class。在物理體系里,這個分類和相變的對稱性破缺有關。

-------

@Alex Huang 問了一個很好的問題:重整化群對什麼樣的系統是有效的?也就是說,什麼情況下這個辦法能有效的簡化模型,降低計算量?

重整化群有效本質原因是不同尺度的過程之間往往有一種相對的獨立性。如果你的系統是這樣的,那重整化群的方法會給你有用的結果。

想像一下你站在一艘長200米的大輪船上,波長一米的小浪你能感覺到嗎?即使同樣的浪高,如果波長變成200米,這浪就能讓船晃起來,讓你暈的不行。所以,短距離的過程(波長一米的浪)對長距離的過程(大船的行駛)基本影響不大,最多可能就是改變了大船遇到的阻力。所以如果我們在模擬時可以不直接再現這種短距離過程,只要改變一些長距離的參數(行船的阻力)把它們的影響合適的加進去,就仍然可以精確的模擬系統長距離上的行為。當然在更複雜的問題里,你需要用計算的方法得出每一個參數隨RG scale的變化,這樣你自然能算出最終那些參數是重要的。

-------

最後,我在這裡故意迴避了量子場論,犧牲了一些技術細節,是想讓非物理專業的讀者對重整化的概念和操作有一個直觀的認識。本文的目的是讓讀者以後能想起來用RG的思路解決問題。以上對RG的理解是上世紀量子場論的重大進步之一,後來也被用於描述其它物理體系。主要的推動者是前年去世的 Kenneth G. Wilson, 這個理解方式也被叫做Wilsonian RG。基於這個想法,Wilson同時也提出了用離散格點模擬量子場論的辦法,這個方法今天叫lattice QCD, 需要用到目前世界上最好的超級計算機,和本文中水分子模擬也有更多直接對應的地方。我昨天聽說,lattice qcd終於被發展到可以從第一原理出發,精確的計算質子和中子的質量差。(這也是當下唯一的辦法。) Wilson泉下有知,也可以安心了!本小弱特以此文向Wilson和做lattice qcd的猛士們致敬。


RG示意圖

粗粒化到底在幹嘛


所謂粗粒化,就是在干類似這種事情,從上到下像素在降低,也就是標尺在增大。


對於具有自相似性的系統,我們在不同的標度 (即不同的標尺刻度)下對其進行觀察時,會發現這種系統具有所謂的「標度不變性" 。從上圖可以看到, 圖片從a到d的過程標尺在擴大,d與a相比一些細節被平均掉了,但d與a有著相似的結構,圖像的基本特徵是完全相同的。" 這意味著在不同的標度下,系統表現出的物理行為本質上相同" 這一性質就叫做標度不變性" 。標度不變性對應著一種對稱性,描述對稱性的工具是群論。粗粒化過程丟失了一部分信息,因此這種操作是不可逆的,所以重整化群是一種半群。


既然重整化群方法在操作中拋掉那麼多信息,那它還可以用嗎?

重整化的應用是有前提的,就是在臨界點附近這種粗粒化處理才有效。否則就是耍流氓,你隨便把一個問題給粗粒化一下就像第一個圖一樣,信息丟失很嚴重,已經抓不住物理實質了。平均化之後顯然不是原來的樣子了,掩蓋了突出問題。這就是為什麼我朝總喜歡人均GDP、人均可支配收入,一平均化很多信息就沒了,能掩蓋很多社會矛盾,所以呀tg很會耍流氓。


還是得提一點物理

重整化群方法

Kenneth G. Wilson(1936 6 .8—2013 6 .8)美國物理學家。因建立相變的臨界現象理論,即重正化群變換理論,獲得了1982年度諾貝爾物理學獎。

Wilson 認為:相變的臨界現象與物理學其他現象不同的地方在於,人們必須在相當寬廣的尺度上與系統中的漲落打交道。所有尺度上的漲落在臨界點都是重要的,因此,在進行理論描述時,要考慮到整個漲落譜。威爾遜的臨界現象理論是在重正化群變換理論的基礎上作了實質性的修改後建立的。威爾遜的臨界現象理論,全面闡述了物質接近於臨界點的變化情況,還提供了這些臨界量的數值計算方法。

基本思想

重整化群的基本思想是把關聯長度發散的臨界點與非線性變換的不動點聯繫起來,這是統計物理學的一種新的方法,即不直接計算配分函數Z,而是研究配分函數z保持不變的變換性質,重整化群之所以能描述連續相變就是因為該相變具有不動點,並對應著關聯長度趨於無窮,這樣一來,連續相變的研究可以化為研究非線性化變換在不動點和不動點附近線性化後的群方程的本徵值問題。因此說:重整化群方法開創了臨界現象的微觀理論,而且這種方法在物理學其他領域中的無限自由度問題的研究提供了重要的思想方法。

重整化群的概念起源於量子場論,為了處理量子場論中的發散問題,人們發展了重整化的方法來剪除無窮大。由於物理量是客觀的,應該與剪除點的具體選擇無關,所以當剪除點變化時,有關的物 理量應當保持不變。表示剪除點變化的變換就叫做重整化群變換。儘管重整化群並不是嚴格意義下的 群,但是這種在變換下的不變性的思想,即對稱性的思想,確實是 (20世紀後半葉物理學中最為重要的思想 。卡丹諾夫和維爾森等人將重整化群的方法用於臨界現象(連續相變),發現在臨界點附近系統在不同尺度上所表現出的自相似性恰好能用重整化群的方法來描述。這一發現不僅為連續相變找到了一種更為合理和有效的理論表述,而且為重整化群方法找到了更為直接的物理基礎 。

統計物理中重整化群方法主要用來解決臨界點相變行為。用重整化群方法來消除自由度,得到變換前後體系的耦合常數的遞推關係,建立RG方程。


飛魚的答案很好,我整理幾個要點,供大家參考:
1、多體相互作用物理系統理論上可解,因為參數和公式等等很清楚。
2、該系統實際不可解,計算機的計算量跟不上,因為計算量隨體系增大指數上升。
3、假如整個體系有10^26個自由度,實際上10000個自由度已經包含99%的信息,能夠準確描述該多體系統,冗餘的自由度可以刪減掉
4、被刪減的自由度,一般來說不是「自然的自由度」,而是「重整化後的自由度」,類比為坐標變換
5、重整化是一個迭代進行的計算過程。


謝邀。

很意外地,這問題竟然有「深度學習(Deep Learning)」這個標籤,大概是因為深度學習(Deep Learning, DL)和重整化群(Renormalization Group, RG)關係的那一篇文章吧。跟大眾非物理專業的同學講解和向數據科學/計算機科學的同學講解RG可是不太一樣。

如果是向一般普羅大眾談RG,我只會說這是一個像照像機zoom out的過程,在zoom out後只剩下比較相關的消息。其他就呵呵了。

如果向計算機科學的同學講解的話,大可以指出這是統計物理的理論,但可以推演到多體或集體系統,而這系統必定接近臨界點,其系統有自相似性。重整化群的意思就是一個粗粒化處理(但也不妨用zoom out一字),由於系統有自相似性,zoom out後系統並沒有改變,不過當中一些無關的特徵在zoom out後被減弱了,那我們就知道系統中那一些參數是不必要的。同樣地,用DL經過幾層的計算後,一些特徵消失了,也是因為DL和RG在某些程況下等價的原因。


模型越精確就越複雜,如何在兩者之間做一個平衡。

1. 對於一個費米尺度上發生的物理現象,我想建立一個模型;
2.我不想直接用比這個尺度小一千倍的層次上的物理規律(儘管那樣很精確,但是太麻煩了);
3.但是我又想知道那個小一千倍的尺度上的物理內容對我現在的模型有什麼影響,這個影響有多大,對我目前的結果的精度有多大影響。

這就是重整化。(就是我可以用一種成體系的、高效的方法評估:我忽略的那些細節,對我的結果會有多大精度的影響,以及以一種相對簡單的方式,把這些被忽略的細節包括到我的模型裡面)

========================================

研究海洋的洋流和渦旋,不需要知道夸克和膠子是如何相互作用的。但是我可以用重整化群去評估,夸克膠子之間發生的事情對海洋的洋流有多大的影響。(當然,在這個例子中,是沒有影響;在其他例子裡面,會有影響,但我可以用一種簡單的方式把這個影響包含到我的模型里,使得精度變好一些。)


1.最成熟的描述基本粒子相互作用是一種積分方法(泛函積分或路徑積分);
2.但這種積分方法會遇到發散情況(逐級展開的微擾近似),重整化是用來處理髮散的 ;
3.發散來源於對基本粒子描述的局限性,如無半徑的點粒子等;
4.重整化把發散部分抽取,人為設置為有限量以符合現實世界的情況;
5.重整化後仍保持對稱性。


請也向物理專業的解釋下。


作為一名非物理專業的學生,看完上面大牛們的解答,我得出一個比較簡單的結論:
比如一次你去入職體檢,需要測出你的身高,利用最精確的儀器,測出你除去鞋底鞋墊,還有頭髮的厚度,你的身高是1492503um;
然後你去填寫發現格子里填不下,於是你就填寫了1492mm上交給單位;
然而單位在登記的時候並不需要這麼高的精確度,於是輸入了149cm;
而你在介紹自己的時候更不需要太高的精確度,於是你在入職第一次自我介紹時說自己150;
但是無論如何精簡,如何四捨五入,你也永遠不會說自己1m或者是2m;
好了,總的來說,就是通過變化計量單位,在對結果產生最小影響的情況下,最大的節約資源提高效率。
不知道我說的對不對,個人感覺這和經濟計量中精確度的選擇和無關量的排除很相似,而後面捨去的精確度便是計量誤差項(random error term)。
如果有什麼不對的地方,還請各位大神多多指點。
謝謝!


I think there is another aspect to this, which is why some systems can be treated with the renormalization procedure. Not every system can be treated so. It"s a gift, not a given.

-----


0. The fact a system can be treated with renormalization has nothing to do with RG. If you read Wilson. He stresses to death: it is only because the system has a very large correlation length. And in some case, it turns out that integrating away the degrees of freedom with a RG scale (usually of order unity) is much much easier than solving the wproblem at one shot. The key is this, some properties of the system is very persistent to the RG procedure, that is, they don"t change much after one RG step, two RG steps, etc.. There are only a few such quantities --- partition function is the probably the most important.

A few things that seem very interesting to me.

1. Scaling --- not only the scaling of time or length, but also the scaling of the degrees of freedom of the system. Coarse graining can be done on almost every system, but not scaling. If you are interested in the system itself, but not in the coarse grained system, you have to scale your rulers after one step of coarse graining so that the coarse grained system speaks the same language as the original system. Then you look at the change in the coupling constants, and information can be obtained about the original system.

What is mentioned in the water example in the top post is a coarse graining game. The jewels of re renormalization is largely left out. The field of coarse graining computations is actually growing very fast. They reply on mostly on principles -- 1. Maximum entropy principle; 2. Minimization of relative entropy -- both reply on the concavity of the exponential function -- which actually rises to the concavity of thermodynamics.

2. Criticality --- this is quite a mystery--the fact that nontrivial fixed points exist. They imply continuous phase transitions. In fact, these fixed points take on many many different forms. This says why there can be singularity in the statistical behavior with a perfectly analytical Hamiltonian. They also imply in a weak sense, universality. They also imply all sorts of scaling laws in the form of equality, which thermodynamics only dictates as inequalities.

3. Field theory &<-&> stat mech --- Look at any table of universality classes, and wonder how the classification is actually done. Turns out conformal field theory can do a very good job, mostly in 2d. In fact, if you wipe away the thick shell of formalism, the renormalization in the field theory and that in stat mech is essentially the same.

4. Critical dynamics --- This actually interests me the most. The question is this, how does a system reach equilibrium? Is there anything universal? Turns out given a universality class, small dynamics universality classes can be divided and classified within. The dynamics has to be local though. For example, a cluster Monte Carlo is not universal.

5. Turns out RG is a very good tool to approximate --- The reason is this, sometimes if you do many small approximations in small steps, the result actually can be better than doing a approximation in one shot. People do this for example on the criticality of molecular fluids, which honestly is a far far harder task than lattice systems.

Got to go. More to come.





重整化就是對模型進行了某種簡化,結果能達到同樣的模擬效果。

就好像地圖對實際地形進行了某種簡化,比如比例變化了,減少了很多細節,但是能夠反應相同的性質。

之所以可行,是因為系統的不同層級之間存在某種自相似性,就好像河流的分形。


物理專業的也沒看懂
(╯‵□′)╯︵┻━┻


貌似可以用多大的距離/尺度上刻畫一個美女來描述吧。。。


拿一張紙帶,一端旋轉後粘貼,形成一個怪環,他的特點是人沿著他走一圈,可以遍歷整個世界,往前走可以在後面,本來在紙上面到了紙背面。
然後你把這個怪環展開,形成一個二維平面,以二維來看三維,就是一個一直前進的物體,走到邊緣從另一個邊緣產生。
我們可以用這種思維把高維運動投射到二維平面進行研究,也就是重整化。


如果你的計算機能力無限大…… 那麼你就可以參透世界到底是虛擬的還是真實的。 因為你有種可以模擬,也有資源可以模擬一個宇宙的所有細節。


理論物理專業,碩士。
我只能說我不適合學物理。重整化是個笑話


我是化學專業畢業,你別向我解釋物理,我不聽我不聽我任性。


推薦閱讀:

TAG:物理學 | 量子場論 | 工科 | 重整化理論 |