熵簡介
08-31
熵簡介
來自專欄數據挖掘
熵是香農在1948年提出來的,是資訊理論最基本的概念之一。假設 是一個隨機變數,那麼定義 的熵為 .
.
熵是對一個隨機變數不確定度的衡量。例如給出兩個集合。集合 .集合
.直觀上,我們有一個感覺,那就是 比 要整齊一點。那麼,如何將這種整齊量化呢,這就是熵定義的意義,它把混亂,整齊這種定義定量化了。知道了一個變數的熵定義之後,我們定義條件熵。
接下來我們定義聯合變數的熵
有了這些,我們可以得出多個連續變數的熵,根據鏈式法則
考慮這樣一個情況,假設男生 想追女生 .在完全不知情的情況下,這個男生追上這個妹子的概率是 .假設男生追妹子看成變數 ,那麼 的熵是1.現在假設這個男生提前認識了這個妹子的閨蜜,從而知道了這個妹子的一些喜好,比如偶像是朱一龍等,那麼這個男生追上這個妹子的概率變成了 .熵變成了 .我們可以看到,因為提前知道了某些條件,這個男生追上這個妹子的不確定度變小了。為了衡量這個特點,我們引入互信息的概念。
.
用它來衡量 變數對於 不確定度的減小作用。通常,如果 越大,則說明 和 之間關係越密切。
推薦閱讀:
※計算機二級、計算機二級office備考攻略
※計算機的輻射知識
※軍人職稱外語和計算機考試成績放寬條件及規定
※輕易不要升級win10
※《自然原理》新時空理論解開物質結構的基礎和工具—最強力程計算中國人工和日本世界最強計算機結果一樣
TAG:計算機 |