學堂在線《應用資訊理論基礎》學習筆記01

04-06

資訊理論

/*#########################################################

學堂在線《應用資訊理論基礎》學習筆記

慕課網址：

http://www.xuetangx.com/courses/course-v1:TsinghuaX+70230063X+sp/about

#########################################################*/

1. 資訊理論的基本概念

1.1. 信息熵

1.1.1. 隨機變數的自信息

我們日常生活中會說一個事情「信息量太大了」，一個人說話「信息量太大了」。那麼作為研究信息的理論——資訊理論——又是怎樣定義「信息量」的呢？讓我們先想一下直覺上的感受，比如：一卡車相同的beatles單曲CD承載的信息量很大嗎，是不是數據量越大信息量越大呢？我們想一想會很輕易地回答「不是的」。那麼信息量的大小怎麼衡量呢？香農是這樣看待信息量：

信息是對不確定性的消除。比如說，夏天預報明天下雪和冬天預報明天下雪哪個「信息量」更大呢？我們在冬天聽到明天下可能並不感到奇怪，也就是消除的不確定性小；在夏天聽到明天下雪則會感到很驚奇，也就是消除的不確定性大，信息量很大。

我們發現隨機事件的自信息是一個和隨機事件的概率緊密關聯的一個量，概率越低的隨機事件提供的自信息越大，概率越高的隨機事件提供的自信息越小。如果一個隨機事件的概率為1，那麼很顯然它是一個確定性事件，它能提供的信息量為零，因為沒有任何的不確定性被消除。而隨著事件發生的概率越來越小，它能夠提供的信息量越來越大，當隨機事件概率趨向0時，它的信息量趨向無窮大。還有，很符合直觀感覺的是，當兩個獨立的隨機事件同時出現的時候，它們所提供的信息量則是它們這兩個隨機事件各自信息量的算術和。至此，我們得到了隨機事件的自信息的四個基本性質：

1. 概率越低的隨機事件提供的自信息越大，概率越高的隨機事件提供的自信息越小；

2. 如果一個隨機事件的概率為1，它的信息量為零；

3. 如果一個隨機事件的概率為0，它的信息量無窮大；

4. 當兩個獨立的隨機事件同時出現的時候，它們所提供的信息量則是它們這兩個隨機事件各自信息量的算術和。

也就是：