哈密頓原理和拉格朗日函數的由來是怎樣的?

哈密頓原理這個乍一眼看過去如此反人類直覺的原理是怎麼發現的?的確應該有一個量在實際運動情況下取極值 這我可以接受 但是憑什麼這個量就應該是這樣的數學形式呢? 憑什麼是時間的積分,不是路程的積分,更不是其他的數學形勢比如微分什麼的?憑什麼被積分的是一個用來表徵系統的以拉格朗日命名的函數?然後拉格朗日函數又是怎麼來的呢?這個拉格朗日函數和拉格朗日乘數法中的拉格朗日函數有聯繫嗎?為什麼它可以表徵系統?拉格朗日函數有具體的物理意義嗎?
別告訴我哈密頓原理是用拉格朗日方程推導出的 自然裡面包含有拉格朗日函數首先我想知道更本質上的東西(原則上拉格朗日方程應該由哈密頓原理來推導 因為哈密頓原理更本質)其次那拉格朗日方程里的拉格朗日函數又是怎麼來的呢?


最小作用量原理的歷史沿革

原創
所有參考資料來自wikipedia和清華大學李岩松老師的講義


光學中的「最短路程原理」,早在古希臘時代,歐幾里得和海倫(就是三角形海倫公式的那個海倫)等人就提出過。
但早期的「最短路程原理」更多是一種哲學概念,真正將之變為科學理論,並應用其解決實際問題的是費馬(1601~1665),他應用「最短路程原理」準確地解釋了光在連續變化介質中的光路。因此,後來最短光程原理又被稱為費馬原理
費馬原理影響了包括萊布尼茨(1649~1716)和歐拉(1707~1783)在內的一大批數學家。成為了變分法出現的一個重要契機。
事實上,變分法出現的契機除費馬原理以外,更重要的是當時風靡一時的最速降線問題。約翰·伯努利(1667~1748)可能本來只是想裝個逼,他應該也沒想到這個問題後來引起了泛函和分析力學的革命。在這個問題的解答上,伯努利、萊布尼茨等人已經很接近變分法的大門了。
一般認為現代變分法是1744年由歐拉提出的,他提出了著名的歐拉方程:
frac{mathrm{d}}{mathrm{d}x}(frac{partial{F}}{partial{y

到這裡,後續的拉格朗日、哈密頓等人做的事情所需要的數學基礎都已經有了。剩下的工作就是把這些數學應用到解釋世界上,賦予方程物理意義。
簡單概括一下:從「某個量取極值」這個角度來考慮問題(泛函極值),這種思想從古希臘時期就有了。費馬成功將其應用到光學上並有所成就。這種思想在解決最速降線問題上也派了用場。
最速降線問題是牛頓時代的著名問題(牛頓本人也是最早解出這一問題的幾位大牛之一),牛頓定律是人類首次得到力學的第一性原理,是人類用科學方法解釋世界的一大成功。
此時,那個叫歐拉的人把之前這些零散的泛函極值問題用數學語言說清楚了。

那麼,把變分法這個最新的數學工具應用到解釋世界上,應該是一個很自然的思路了吧。

實際上,早在歐拉之前,萊布尼茨就曾經這樣做過了(雖然他並沒有完全確立變分法的數學基礎)。別以為萊布尼茨只是個純數學家,只在微積分的發明上和牛頓叫板,其實他也是做過力學第一性原理的嘗試的。是他最早提出了「作用量」的概念,他定義的作用量:
S=int_{t_0}^{t_1}mv^2mathrm{d}t
(至於為啥萊布尼茨定義的作用量是對時間積分而不是對路程積分,那我就不知道了)
萊布尼茨聲稱:在所有可能的運動軌跡中,真實軌跡的作用量取極值(極大或極小)
不難發現,如果理想完整約束下系統是穩定且保守的(加上這麼一大堆理想化的條件之後):
mv^2=2T=T+E-V=L+E
也就是說,萊布尼茨的作用量和後來哈密頓的作用量只差一個積分號裡面的能量E。

萊布尼茨的作用量極值原理是錯誤的,並沒有得到廣泛的認可。但或許人們收到了他的啟發,開始有人去思考能量相同軌道的作用量。這種想法是否自然呢?
我們今天當然知道,哈密頓原理是正確的,這是事實驗證的。為啥當時沒人鳥萊布尼茨?因為他的原理有時候會出錯。然而,這時人們發現,在能量一定的時候,萊布尼茨原理會給出正確的結果(那是當然,因為這個時候它和哈密頓原理的結果是一樣的)。
那麼,這個時候,來研究能量一定的情況下的作用量似乎是比較自然的思路。
以此為基礎,L. Maupertuis(中文一般是翻譯成莫陪督?)於1747 年提出了力學中最早的(正確的)最小作用量原理,史稱莫陪督原理。莫陪督的作用量定義為:
S=int_{q_0}^{q_1}pmathrm{d}q,其中q是坐標,p是動量。(你看,莫陪督作用量就是對路程積分的!)
莫陪督原理的敘述是:在位形空間的給定兩點間所有能量相同的軌跡中,實際軌跡的莫陪督作用量取極小值。
為啥莫陪督作用量對路程積分,而不是對時間積分了?很簡單,因為給定兩點間能量相同的軌跡,經過始末點的時間是不一樣的,因此作用量變分時,兩端時間不能固定。
可以證明莫陪督原理和哈密頓原理是等價的。莫陪督原理是很有用的,它適合用來解決兩固定點間的軌跡變分問題。

至此,將變分法應用到力學中的嘗試已經部分成功了。
不過,莫陪督解決的這類問題並不是力學問題的全部。他還沒有給出一個第一性原理。


花開兩朵,各表一枝。下面我們從牛頓定律出發,換個方向來考慮這個問題。

那時人類所掌握的力學第一性原理是偉大的牛頓定律。
什麼叫第一性原理?就是說,原則上運用牛頓定律可以解決一切力學問題。一切!
但,為什麼要說原則上?
因為實際上,有一些問題是複雜到你用牛頓那一套方法解不出來的。
牛頓定律是一套強大的工具,但並不是萬能的。例如有很複雜的約束的情況(比如說,研究一個放在表明已知凹凸不平的桌面上的小球的運動),用受力分析和加速度那一套來解會麻煩死的。
人們應對約束這個問題,想了很多辦法,虛功原理就是其中非常有效的一種。其中虛位移的概念,其實已經很有一些變分的味道了。
達朗貝爾(1717~1783)第一次將虛功原理和牛頓定律結合起來,於1743年《動力學》一書中提出了達朗貝爾原理:
Sigma_i(F_i-m_i ddot{r_i})delta r_i=0
敘述為:主動力和慣性力在系統任何虛位移下所做的元功之和為零。
這個原理和牛頓定律是完全等價的。但實際上稍加觀察就會發現,這完全就是虛功原理加上牛頓第二定律,並沒有什麼創新性嘛,只是把它們寫成一個方程比較好看而已(很像數學家乾的事哦)。
接下來,拉格朗日(1736~1813)在達朗貝爾的基礎上,於1788年發表了《分析力學》一書(據說,他很驕傲地說:「我整本力學書沒用一張圖!」),這被看作是分析力學的開端。書中提出了拉格朗日方程:
frac{mathrm{d}}{mathrm{d}t}(frac{partial{L}}{partial{dot{q}}})-frac{partial{L}}{partial{q}}=0,其中L=T-V,q是廣義坐標
這不是和前面的歐拉方程長得一模一樣嗎?
沒錯。不難想像,他就是為了湊這個形式,才這樣定義拉格朗日函數L的。
為什麼要湊這個形式?因為這個形式的變分前人已經研究清楚了,只要把方程寫成這個形式,就把未知問題轉化為已知問題了。可以省去自己大量的計算工作,誰不想偷點懶呢?
這樣,大概拉格朗日函數L的奇怪定義就不那麼難理解了吧。

可以證明,拉格朗日方程和達朗貝爾原理是等價的,而達朗貝爾原理和牛頓定律是等價的。因此,拉格朗日方程就和牛頓定律一樣是力學的第一性原理了。
大家發現,這個方程很有用。對於複雜約束問題,它比牛頓定律方便多了!
因此,拉格朗日這哥們兒一下子就牛逼了。

歐拉-拉格朗日方程是一個跟變分法有關的方程,但到這裡仍然不是大家最熟悉的那個最小作用量原理。
大家熟悉的最小作用量原理是哈密頓(1805~1865)在1834年提出的。哈密頓作用量定義為:
S=int_{t_0}^{t_1}Lmathrm{d}t,L就是上面那個拉格朗日函數
哈密頓聲稱:滿足約束的所有可能的運動軌跡中,真實軌跡的作用量取最小值。
也即,寫成泛函變分的形式:delta S=0
可以證明,它和拉格朗日方程是等價的。也就是說,它和牛頓定律也是等價的,也是力學第一性原理。
覺不覺得哈密頓原理長得和之前的萊布尼茨原理和莫陪督原理很像?
不難想像,哈密頓一定是受了兩方面的啟發,用最小作用量的數學語言,敘述一個和已知正確的拉格朗日方程等價的結論。

至此,一開始看起來不自然的一切,是不是都顯得自然了許多?
一貫地,數學工具(變分法)是先於物理原理出現的。變分法這個數學工具是受到之前費馬伯努利等人的啟發而出現的。
人們研究泛函變分的初衷是從宏觀上(或者說從積分意義上)來解決問題。這種意識是從光學中來的,最早可追溯到古希臘。
在有了數學工具以後,人們迫不及待地將之投入力學問題中,但沒有完全成功了(結論錯誤,或者不全面)。
相反,這個時候另一批人從微觀(或者說從微分意義上)出發,一步一腳印地尋找牛頓定律的等價描述,直到拉格朗日獲得成功。
(其實,歐拉-拉格朗日方程雖然是從微分出發的,但也是變分法的產物。這是由於,虛功原理就已經包含了變分的思想。)
此時,時機已成熟,哈密頓才得以將兩方的成果綜合起來,用最小作用量原理的形式描述了一個力學第一性定律。或者說,拉格朗日方程是微分變分原理,哈密頓原理是積分變分原理。如果沒有前人的那些嘗試,哈密頓的最小作用量原理就如同空中樓閣,是不可能建起來的。


就是最小作用量原理吧,以前研究光,發現光總是走光程最短的路徑;後來發現質點的運動也有類似的特性。函數形式則是為了能與牛頓力學兼容湊出來的。
現在通過量子力學大家明白了,物質也是波,動能與物質波的頻率成正比:E = h upsilon,那麼頻率對時間的積分就是波周數,跟費馬原理中的光程是一樣的。說明還是惠更斯比較厲害。


我從比較大的方向答一下題主的問題。

首先由於歷史的原因,牛頓力學出現在前,分析力學出現在後,在中間實際是出現啦一些過度的原理,也就是著名的虛功原理,利用虛位移的一個概念,利用牛頓力學可以把虛功原理推出來,而利用虛功原理的兩邊一邊是勢能對坐標的微分,一邊是力,把力改寫成(動能對速度的微分)在對時間求個導數(你可以翻梁昆淼的力學下,懶得打公式.....),你一移號,再令L=T-V,你發現得到的就是歐拉 拉格朗日方程。這一步驟完成了從牛頓力學到分析力學的一個過渡。

然後,數學學家研究的變分問題實際已經可以把歐拉拉格朗日方程從一個變分等於零的式子中提取出來。所以物理學家就把,牛頓方程和一個變分式子等價起來,即某一個S的變分等於零,S即為作用量,這一原理也被稱為最小作用量原理啦。

上面是牛頓體系到最小作用量的一個溝通過程,可以說實際也是比較經典的一條道路,完全是由數學工具溝通的一個表達式的變化而已,並沒有十分深刻的內容。而朗道的力學和場論開頭即向我們展示了一個從開始就扔掉力這個輔助概念,完全由對稱性來考慮,去把考察體系所具有的對稱性用一個特殊的拉氏量體現出來。這也是近代物理學家一個考察物理的方式就是以對稱的觀點來看問題,並且構造相應的拉式量來解決問題。但如果只在力學範疇內,分析力學和牛頓力學也就打個平手,因為分析力學的最大優勢是體現在具有完整約束的體系中,每多一個完整約束即意味少了一個廣義坐標,而具有耗散力的體系,或者不完整約束的體系則需要對歐拉拉格朗日方程做出一定的修正,有時未必有牛頓力學來的直觀方便,尤其是本身就需要求解約束力的時候,但無疑分析力學的方式要優雅的多。

故事講到這裡還沒有結束,分析力學之所以可以成為今天與其他三大齊名的四大力學,應該完全得益與上個世紀量子力學和量子場論的發展。最小作用量原理完全是可以是以另一種方式導出,費曼提出他的路徑積分,把量子力學和量子場論中的問題都轉化為了一個加權平均的問題,而這個權重是一個exp形式而指數上的就是iS S是一個條路徑上的作用量。並且近一步的計算會發現,主要貢獻的那些路徑都是在一條特殊路徑的周圍,而這條特殊的路徑就是經典路徑,得到這條路徑的方法也是取S的變分為零,也就是最小作用量原理。所以這麼來看,最小作用量原理的圖像並不是粒子總會走那些作用量最小的路徑,而是粒子每條路徑都會走,但作用量最小的那條路徑權重是最大的。

說了這麼多,既然認為最小作用量是一個principle,從某種角度上來看它肯定是無法推出的。只是我們有太多理由去相信它是正確的並且可以描述我們這個世界的現象。物理學家發現能用對稱性來有效處理問題以後,對稱性幾乎成了一種信仰。最小作用量以是基於我們相信世界本原優雅性的一種信仰啦。


最小作用量原理(哈密頓原理)並不反直覺,
就像我們可以把x_0=1同時理解為一元方程x-1=0的根或者使得函數f(x)=(x-1)^2取極小值的點那樣,我們也可以把運動方程r(t)同時理解為微分方程F=m ddot{r}的解或者使得泛函

int_{t1}^{t2}Ldt =0取極小值的函數。
可以通過如下的類比來理解最小作用量原理:
一元方程&<---&>一元函數的極值條件
微分方程&<---&>作用量的極值條件
於是就有
1.牛頓力學:以微分方程F=m ddot{r}+初始條件r(t_0),dot{r}(t_0)來確定運動方程r(t)
2.拉格朗日力學:以泛函極值delta int_{t1}^{t2}Ldt =0+給定的端點q(t_1),q(t_2),來確定運動方程q(t)
所以在L的形式給定之前,完全是數學上的處理。
至於這個L的形式則依賴於空間的性質,以朗道《力學》里推導自由質點的Lagrangian為例,
由經驗,我們認為L只和位置,位置的一階導數,時間有關;
由空間的對稱性,推出L=L(v^2);
再由伽利略相對性原理,推出Lpropto v^2,比例係數設為frac{m}{2}
對於有相互作用的系統,再引入勢能項V,具體可以參考朗道《力學》的第1,2,8章。


本來只是對拉格朗日感興趣,沒想到引出了這麼多大魚。。。哈密頓原理,變分,泛函。。。得慢慢啃書了


拉格朗日方程和牛頓定律一樣,也是一種力學系統的描述形式,同時他對於各種廣義坐標都有相同的形式,而哈密頓原理亦歸結於拉格朗日方程,安利一篇文章,有詳細的解釋:如何理解拉格朗日方程


應該就是一個最值函數問題吧,怎樣找一個最速曲線。


推薦閱讀:

希格斯玻色子是什麼?
物理學中有哪些不講道理的常量?
有哪些需要很高深數學知識的物理?
平行空間是否存在?
被黑洞吸引會有什麼樣的感覺,會被拉成義大利面嗎?

TAG:物理學 | 理論物理 | 高等數學 | 力學 | 理論力學 |