橫看成嶺側成峰,測度勢綱各不同

從學數學開始,我們就有了「比較」這個概念,小學的時候以知道「100分比99分」高而為榮,而從學了集合以後,時不時還會比較一些集合之間的大小關係,最常見的方法就是以集合的元素個數的多少作為衡量標準。比如含有50個元素的集合自然比含有30 個元素的集合要看起來「大」一些,這樣的觀點在集合元素個數有限的情況下,倒也十分正確,因為這非常符合人們的認知和實踐經驗。但數學畢竟即是科學,也是藝術。一些人覺得有限的東西比來比去就那麼回事兒,真無聊,無限的集合之間應該怎麼比呢?作者在剛上大學的時候曾經就和室友討論過這個問題,當時剛剛學了淺薄的集合論,於是和室友爭論「[0,1]與[0,2]中的實數哪個更多?」,室友一直認為前者是後者的子集,所以後者更多,作者認為這倆其實是一樣多的,因為把後者中的每個數除二就是前者中的實數了,當時誰也說服不了誰,雙方一度認為對方的腦子有坑。但隨著學習的深入,作者發現自己的腦子確實有坑,因為比較「多少」首先要有一個標準,不同的標準下結果可能相同,也可能不同。而這篇小文章就是想和讀者分享現代觀點下,集合之間的大小關係的三個衡量標準:基數(勢),測度,綱。而且為了保證可讀性,文中不會出現冗雜的數學推導與證明,相應的一些重要結果僅僅略微提及,更多的是常見的集合之間「大小」比較的例子。這些例子中,往往穿插了一些近代數學中較為「詭異」的現象,很值得在學習過程中引起注意。

1.基數(勢)

從有限上升到無窮,眼界其實得到了質的飛躍,首先應該修正一個常見的認識:子集的元素個數僅僅是不比原集多,而不是一定比原集少。

基於此,著名的數學家康托(cantor,1945-1918)就認為,兩個集合的元素個數相等,應該等價於兩個集合之間存在一個一一映射。在有限集下,這顯然是正確的,只需要將兩個元素的集合一一配對,即找到了這個一一映射。而在無限集下呢,就有許多很有趣的結果。比如之前提到的[0,1]區間與[0,2]區間中的實數個數在這種觀點下就是一樣多的(因為 f(x)=2x 就是它們之間的一一映射),類似地有(0,1)與R的實數個數是相同的( f(x)=	an[(x-frac{1}{2})pi] 就是它們之間的一個一一映射),任意有限維的歐式空間的元素個數都相同。

而無窮之間存在大小關係的例子呢?其實也相當多,比如一入門就提到的:「無理數的個數比有理數多「,」實數軸上的全體函數比實數多」。但粗略來說,這些集合的元素個數都是無窮大,但在這種觀點下,無窮大之間也應該有大小之分,於是就定義了「基數」(cardinal number)、又稱「勢」這樣的概念。對於有限集的基數直接定義為它們的元素個數,而無限集的基數則是人為定義的。

我們把自然數集的個數的個數定義為 aleph_0 ,這個字母是希伯來字母,中文音讀作阿列夫,即自然數集的個數為阿列夫零.實數集的個數定義為 aleph_1 .同時稱基數為 aleph_0 的集合為「可數集」,故名思議,即集合中的元素可以被數盡,也就是可以被標號成 a_1,a_2,a_3... ,而基數大於等於 aleph_1 的集合成為「不可數集」,比如實數集就是典型的不可數集,比如當你想從0開始用一套規則標號後一直數下去的時候,已經不知道下一位實數是何方神聖了,但有理數確實可以像自然數一樣,將所有數標號「數」完!當然這僅僅是一個定義,其他的集合的基數就可以通過與已知基數的集合是否能建立一一映射來確定,也就是在無窮集合中,它們的比較應該從有限中來,並得到一定的升華:

如果我們用 overset{=}{A} 表示集合 A 的基數,那我們設想基數之間應該和實數一樣也具有三歧性(兩個實數直接只有大於,小於,等於這三種關係中的一種),更希望的是: overset{=}{A}geq overset{=}{B},overset{=}{A}leq overset{=}{B} Rightarrow overset{=}{A} =overset{=}{B} . 翻譯過來就是,你不比我多,我不比你多,那咱倆應該一樣多。直觀想像上應該是正確的,但它的證明確實十分不平凡的,這個結論稱為Schroeder-Bernstein定理,簡稱S.B定理。而在上面表中表示的無窮意義下,更深刻的內涵是:如果A到B有一個滿射,B到A也有一個滿射,那麼它們之間必然有一個一一映射!在這個定理的幫助下,我們很容易得到常見集合的基數:

  • 自然數集,整數集,有理數集,代數數集都是可數集;
  • 單調函數的不連續點構成的集合至多是可數集;
  • 開區間上的凸函數的不可導點構成的集合至多是可數集;
  • 實數集,無理數集,超越數集的基數都是 aleph_1
  • 實軸上的連續函數構成的集合基數為 aleph_1

同時,基數也是可以不斷增大的,在有限集下,如果 overset{=}{A}=n ,取A中的所有子集構成一個新的集合 mathcal{P}(A) ,稱為A的冪集,通過一點排列組合的知識 overset{=}{mathcal{P}(A)}=2^n>n .而在無限集上這件事情也是對的,可以證明確實有 aleph_1=2^{aleph_0} .所以通過不斷生成冪集的冪集,冪集的冪集的冪集,基數是沒有上限的,比如下一個基數 aleph_2=2^{aleph_1} ,對應的集合就是實數軸上的全體函數的個數。 但 aleph_n 之間還存不存在其他的基數,退一步說,自然數集與實數集之間,是否存在集合的基數介於與之間呢?這個問題稱為「連續統假設」,目前仍然是懸而未決。

但神奇的是,這個標準下,並不是所有的集合都能有基數來表示大小的,讀者不妨思考一下這樣的集合(如果存在的話),它裡面的元素所有的基數。那這個集合的基數是多少呢?這就涉及到基數到底有多少,用來描述無窮的無窮是怎麼樣的呢?想兩分鐘晚上睡得可香了。

2.測度

從測度的角度出發去衡量集合的大小,就和之前的基數不太一樣了。我們希望定義一個自變數取值是集合的函數,稱為「集函數」,而因變數的結果是正實數的映射,並且希望符合人們的一些常識,比如空集的大小應該對應0,如果兩個集合不相交的話,他們並起來的測度應該是等於各自測度的和。粗略一點寫就是:存在一個定義在某些集合上的函數,滿足下列兩條:

 mu :mathcal{F} 
ightarrow R^+

egin{eqnarray*} &&(1)mu(emptyset)=0\ &&(2)A_n in mathcal{F}, A_i igcap A_j =emptyset,(forall i,j in N,mu(igcuplimits_{n=1}^{infty}A_n))=sumlimits_{n=1}^{infty}mu(A_n). end{eqnarray*}

本質上說測度相當於給不同的集合「賦值」,然後根據這個值來判斷大小,而滿足上面的函數是在太多了,下面給大家列舉一些常見的測度:

  • 勒貝格測度(Lebesgue Measure)

在R上的勒貝格測度測度除了有上述基本要求外,規則可以簡單敘述為:

  • 單點集的勒貝格測度為0;
  • 非空區間的勒貝格測度等於端點差的絕對值。比如在R中,(0,1)的勒貝格測度就是1。

可以看出,在R上的勒貝格測度實際上就是平日里所說的「長度」概念的推廣,如果推廣到多維歐幾里得空間中,也會對應相應的「體積」,比如二維就是常見的「面積」這個概念,三維對應的是「體積」,之後的也一律可以稱為體積了。

由我們一直敘述下來的定義可以看出來,單點集在是沒有測度的,那可數的個點也是沒有測度的,這些沒有測度的集合統一賦予一個名稱:「零測集」。所以之前在集合的基數理論下得到的結果就可以直接照搬下來了。(以下所指的測度均指R 中的勒貝格測度)

  • 自然數集,整數集,有理數集,代數數集都是零測集;
  • 單調函數的不連續點構成的集合是零測集;
  • 開區間上的凸函數的不可導點構成的集合是零測集;
  • 相同區間上的實數集與無理數集的差是零測集;
  • 可積函數的不連續點集是零測集。
  • 開區間上的凸函數的二階不可導點構成的集合是零測集(Alexandrov theorem)。

從上面一些有趣的結論可以看出,單調函數其實與連續函數長得很像,他們的差別可以幾乎忽略不計了(差別的集合是零測集,意味著幾乎沒有大小!);同時可積函數也是,這個結論也印證了為什麼我們可以算積分的函數,總是「比較」連續的,而像狄利克雷函數這樣的不可積函數,從這個角度來看,因為它不連續的地方太多了(處處不連續);同時也可以看出「凸」是一個相當強的性質了,我們在數學分析中對「凸」的概念只是做了一個簡單介紹,而這些事實告訴我們,開區間上的凸函數除了處處連續以外,「幾乎」存在兩階導數!最後一個事實是一個凸分析中很深刻的定理,以至於我情不自禁要單獨點名表揚一下,但沒事兒建議大家不要翻看。

結合前面說的集合中的基數概念,我們容易看出,可數集,即基數為 aleph_0 的集合一定是零測集,但零測集的基數是否一定為 aleph_0 呢?其實這是不一定的,這裡可以介紹一個常常用來舉反例的有趣的集合——cantor集(沒錯,和前面出現的康托是一個人)

康托集是定義在閉區間[0,1]的構造性的集合,結合下面的圖,很容易有直觀的認識,每次挖掉直線最中間1/3的直線段,不斷重複,最後形成的集合就是康托集,簡記為C。

cantor集模擬圖

運用簡單的等比數列求和的方法就能求出,去掉的長度總和為1!所以容易看出康托集就是一個零測集,但不幸的是,康托集里的元素可以和[0,1]的實數一一對應,所以康托集的基數為。這也是一開始就談到的,集合之間比大小必須先聲明標準。

另外一個有意思的集合叫做sierpinski(1882-1969)地毯,生成的過程和康托集有點相似,將的正方形分成9塊,挖掉中間一塊,再把剩下的每一塊分成9塊,去掉各自中間的一塊,無限進行下去,最終得到的圖形就是sierpinski地毯,同樣,說不明白的地方用張圖就可以看出來

sierphiski地毯模擬圖

類似的三維的情況稱做sierphiski海綿:

sierphiski海綿模擬圖

和你猜的一樣,這兩個集合都是零測集(分別在中),而且基數也都是 aleph_1 ,可見基數和測度之間的標準並不是完全統一的。

不過介紹這三個有意思的集合是為了引出另一個常見的測度。

  • 豪斯多夫測度(Hausdorff Measure)

為了不降低閱讀量,這裡並不打算介紹豪斯多夫測度是怎麼定義的(因為確實有點複雜[捂臉]),只是稍微介紹一下它是描述的集合特徵。粗略來說,豪斯多夫測度描述了集合的維數。藉助豪斯多夫測度,可以得到常見集合的豪斯多夫維數(以下簡稱維數),比如平面上的正方形,維數就是2,直線的維數是1,這和我們平時的認識是一樣的。而上面的康托集,說是一維圖形吧,但人家壓根沒有長度,說是點吧,但人家和實數一樣多,所以康托集的維數應該介於0維到1維之間。同樣,sierpinski 地毯說是二維也不合適,人家沒有面積,但說人家是一維的有點看不起人家。康托集,sierpinski地毯,sierpinski海綿的維數分別為 frac{ln2}{ln3}approx 0.631,frac{ln8}{ln3}approx 1.8928,frac{ln20}{ln3}approx 2.7268 ,而這之後引出的「分形理論」也成了現代數學熱門的一個分支。

值得一提的是,分形理論中有一個著名的皮亞諾曲線(Peano curve),是典型的一維曲線填滿二維空間的例子,而現在你身處的周圍,到底是幾維呢?

3.綱

三種比較方式中,最難科普的方式就是「綱」了,因為其中不得不涉及到一些點集拓撲的概念,為了不降低閱讀量,同樣也只是將重點放在例子上,而不是數學推理上。

接下來要出現幾個簡單的概念,內點,開集,閉集,閉包,疏集。為了降低工作量,我們將情況限制在 歐式空間上的集合A.

  • ain A 是a的內點,如果存在一個的領域 U(a,delta)in A .比如1是[0,2]的內點,但0和2不是;單點集中的點不是內點。
  • A是開集,如果A的所有點都是內點。比如 R 上的開區間都是開集。
  • A是閉集,如果A的補集(余集)是開集。比如 R 上的閉區間都是開集。
  • A的閉包指包含A的最小閉集,如(1,2)的閉包是[1,2].
  • A是疏集,如果A的閉包里不包含內點。整數集在 R 中就是疏集。

這裡面我我們需要的概念就是這個疏集,又稱無處稠密集(nowhere dense set),可以想像的到,內點的概念相當於「拉幫結派」,一個人在裡面不算,還得拉一個團體進去,而一個點集如果沒有內點,意味著每個點周圍都是孤零零的,這個集合有相當大的空洞,就好像前面的sierphiski海綿一樣。但疏集更進一步,是閉包沒有內點,用來描述集合中的點相當的疏遠,集合結構鬆散。

在做了這些鋪墊工作,我們就可以進入「綱」的世界,綱是由貝爾(Baire)提出來的,他認為集合可以大致分為兩類:

  • A為第一綱集(first category),如果A可以表示為 A=igcuplimits_{n=1}^{infty}A_n (即若干 A_n 的並集),其中 A_n 都是疏集。
  • A為第二綱集(second category),如果A不為第一綱集。

從定義可以看出,第一綱集的組成元素都是疏集,表明集合內部到處都是空洞,相對於第二綱集的元素,可以說是少得可憐,而類比前兩個比較方式,我們能順延一些結果,而且還有一些很有趣的例子。

  • 在R中,有理數是第一綱集,無理數是第二綱集。
  • C(R) 表示在 R 上連續的函數,A表示 C(R) 中處處不可導的函數,則A的補集是第一綱集,A是第二綱集。
  • C^{infty}(R) 表示 R 上的無限可導函數,A表示中處處不可以展成泰勒級數的函數,則A的補集是第一綱集,A是第二綱集。
  • R 中,康托集是第一綱集。

第一個例子很直觀的說明了在綱的體系下,有理數也是比無理數要少的多的。中間兩個例子則非常有意思,因為在很長一段時間內數學家都認為連續的函數多多少少為存在可導點,直到維爾斯特拉斯(Weierstrass 1815–1897)提出了一個處處連續但處處不可導的例子,才解決了這個問題。但通過綱的推理,可以看出,在連續函數中,不僅存在處處連續處處不可導的函數,而且相比於那些可導的函數要多得多,可以認為佔了連續函數的主要部分;第三個也說明,無窮可導函數並不意味著能展成泰勒級數,比如 f(0)=0,f(x)=e^{frac{1}{x^2}} 在0點就無法展成泰勒級數。但要構造一個處處不能展成泰勒級數的無窮可導函數,其實還是蠻困難的。通過綱推理,也可以得出,實際上這樣的函數在 C^{infty}(R) 中占絕大多數,所以其實我們目前研究的函數都只是很少很少的一部分,那些沒啥好性質的函數才是大頭。最後一個例子也是想說明,雖然在基數的理論下,康托集的基數比有理數的基數大,所以我們可以說康托集比有理數多得多,但在綱的理論下,康托集其實和有理數集也就是半斤八兩,五十步笑百步,他們在 R 中都是第一綱集。

值得注意的一點是,綱推理下很需要注重「大前提」,比如在 R^2 中,直線上的無理數就是第一綱集了,彷彿遭受了降維打擊。

4.一點拙見。 其實三種比較方式各有各的側重點,我的理解是,基數更側重集合之間的對應關係;測度偏向於量化集合的某些特徵,比如勒貝格測度試圖給出集合的「長度」,豪斯多夫測度想描述集合的「維數」;綱則將注意力集中在集合的內部結構上,第一綱集和第二綱集可能在基數觀點上,元素是一樣多的,但第一綱集中的元素在結構上就非常「稀疏」。這三者交互在一起有許多有趣的結論,但迫於文章性質,這裡並不打算展開,僅僅希望通過這樣的一段文字,激發起讀者對數學的興趣,文章中的所有概念和結論,基本都可以在本科的分析教材中找到,還有更多有趣的結論,就等待你來發掘了。但至少看完本文以後,再有人在你面前扯集合之間的大小關係,上來就可以問TA:「您是用基數比,還是用測度比,還是用綱推理呀。」

註:1、本文僅僅是作者受周圍同學啟發,決定將一些近代數學的觀點結合自己的理解用較為樸素的語言做一個科普,算是一個小小的嘗試。其中必然有諸多不嚴謹的地方,請專業人士批評,同時對這些理論感興趣的讀者,也歡迎和作者交流。

2、本文一開始用tex打的,但破呼好像不太支持直接傳,只好用pandoc轉成word上傳,導致中間的字母看起來有點彆扭,非常抱歉~~~

推薦閱讀:

TAG:集合論 | 測度論 | 數學 |