conjugate(共軛)這個詞在各種數學表達中為什麼意思?最好有物理的來源。

例如conjugate function,~ prior,~ complex numbers. 共軛這個理解也就是在共軛複數有些形象,前兩個是什麼原因取名conjugate?搞優化的好心人把dual一併解釋了最好


Dual 來更新了,雖然答主今年還是掛在了泛函上。。但是還忍著心痛來更新下對Dual的理解吧, 希望對大家有幫助!

對偶在百度中的解釋為:用字數相等、結構相同、意義對稱的一對短語或句子來表達兩個相對應或相近或意思相同的修辭方式。但是在數學中dual其實比語文中修辭方式具有更好的性質。因為基本上數學中的dual不僅包括了結構、意義的相同,還增加了「更優的」條件。

舉兩個例子:

在泛函中的dual space:If X is a normed space, then X" (dual of X) is a Banach. 這樣就多了完備性,空間多了完備性就基本well-defined了, 可以滿足許多「計算」性質了,閉集,有界,緊集等。l2 空間的所有性質都可以滿足。

再來看優化中的dual function:眾所周知,如果能夠找到一個凸函數,就可以找到全局最優了。而一般來說函數都非凸函數,很難找到全局最優,因此如果可以找到它的dual function,就可以保證是個凹函數,這樣一定能找到全局最優解了,不論原函數是否是凸函數。

因此從以上兩個例子來看,在數學中dual,不僅僅保留了跟原始的結構與意義,還保證了其自身性質的最優。

======================================================================

解釋這個還是中文比較形象。軛在維基百科的解釋是:是一種用木製造的梁,用來給兩頭牛拉貨物(牛幾乎總是成對)。

就是牛身上背的這個東西。所以顧名思義 共軛的意思就是 在一根軸上 成對出現的東西。

比如 最簡單的 共軛複數

就很明顯 是根據實數軸成對的兩個複數

同樣比如 凸優化中的conjugate transform 也就是通過共同的hyperplane來做這個函數的對稱圖像

這兩個函數就是通過共軛轉換得到的 通過超平面(此處為切線)所轉換得到的函數, 將原函數的一點處的切線中的斜率與截距 轉換成 新函數的中的變數與應變數 是通過切線軸轉換後成對出現的兩個函數

以此類推 其他共軛的概念也是基於各種「軸」成對點、函數、空間等dual等我考完試再來更新 (已更新)


真想吐槽一下,要是看不慣就摺疊我吧。數值分析課,老師居然把兩個在某種內積下的正交叫做「共軛」……如果線性空間高於兩維的話,這個意義就和「共軛」的意義相差甚遠了吧?


在學習機器學習,在讀 PRML 和 ML probabilistic perspective 其中 conjugate(共軛)這個詞是反覆的出現。一直不太明白其背後的真正的形象意義。

於是特地對conjugate prior (共軛先驗)做了一番工作,理解有限,歡迎補充。

Collins詞典的解釋是 "joined together in pairs, coupled" ,Conjugate | Definition, meaning more 然後舉幾個數學相關的例子,例如:連個互補的角度,兩個虛數4+3j 和 4-3j

共軛的意思很簡單,就是指成對的出現的兩個有很強關係的實體

所以應該從兩個事物的關係出發來理解共軛。舉一個例子,共軛先驗。

PRML書中第二章所說的conjugate prior (共軛先驗),所謂prior (先驗)就是預先的假設,在看書中的內容, p(x|w) 表示給定w後x的分布,是posterior(後驗);p(x) 表示x的分布,是 prior(先驗),如果 p(x|w) 與 p(x) 有共軛的關係,也就是說 p(x|w) 和 p(x) 是同一種分布,例如 p(x) 是D維的高斯分布,給定w後p(x|w)仍舊是D緯的高斯分布。

那麼為什麼需要共軛先驗呢?或者共軛先驗的作用在哪呢?

答案是在兩個都是同種分布的假設下,也就是滿足共軛的條件下,我們能簡化模型的計算

例如在作 sequential Bayesian inference (序列化的貝葉斯推斷,也就是類似多個節點連成糖葫蘆串的圖模型),在共軛的假設前提下 上一步計算出來的後驗概率 p(x_i-1|w) 也能當作當前步的先驗p(x_i) 這樣就能極大的簡化計算。

p.s. 上一段中為了方便理解故意把共軛分布說成同一種分布, 其實只有確定了均值和方差之一的高斯分布的共軛分布還是高斯分布。Bernoulli 分布的共軛分布是Beta,Multinomial 的共軛是 Dirichlet,等,參見PRML

Reference

WIKI Conjugate prior

Some Slide https://courses.engr.illinois.edu/cs598jhm/sp2010/Slides/Lecture02HO.pdf

PRML


這篇文章解釋的也挺到位:

用python做貝葉斯A/B測試 — 貝葉斯A/B測試入門 以及「共軛先驗」是什麼?


推薦閱讀:

關於z score演算法上的總結以及其背後的原理?
建模比賽求一個數學系的大神有沒有必要?
如何評價2015年高教杯數學建模B題?

TAG:數學 | 物理學 | 概率 | 凸優化 |