學不好數學,你可能連朋友也找不到!

學不好數學,你可能連朋友也找不到!

33 人贊了文章

作者:Patrick Honner

翻譯:可樂不加冰

審校:山寺小沙彌

當你進入一所新的學校,找到一份新的工作,或者來到一個新的城市,你該如何結交新的朋友呢?你可以主動去勾搭「交際花」,通過他們結識更多的人;當然也可以「一切隨緣」,在日常交往中逐漸找到朋友。無論你選擇哪種方案,了解人群中現有的社交關係,對你的交友選擇意義重大。

想像一下,如果有一天你搬到了一個奇怪的新城市,在這個城市裡有一個奇怪的規則:每個人最多可以有4個朋友,並且每個人都希望能最大化他們的友誼。那麼這個城市中人們的友誼關係將會呈現出怎樣的結構?

為了探索這個問題,我們將用到數學中的一個概念——網路。

簡單來說,網路是由一系列的節點和他們之間的連接組成的,是一個抽象的數學概念。它既可以指代計算機網路的連接,不同人之間的合作,魔方的不同狀態和擰魔方的操作,當然,也可以指代我們這個城市中的友誼結構——把人看作一個個的節點,而人與人之間的友誼看作是連接。

進行了數學抽象化的表示後,這個城市的友誼網路看上去差不多可能是這樣:

每個人都會努力找到他的4個朋友。當一個新人搬到城裡時,他們會找一個朋友數少於4個的人來建立友誼,通過這種方式,隨著時間的推移,友誼網路變得越來越龐大。當然,不排除有個別人形成了一個「」小圈子,遊離於「大部隊」之外,但是在今天的討論中我們就暫且忽略這種情況,認為所有的人都集中在一張友誼網路之內。

一張網路如果結構清楚明晰,我們往往能從中得到很多信息。但是當節點越來越多,連接越來越密,看上去越來越「無跡可尋」時,簡單的可視化分析可能會變得不大管用。因此,我們需要別的手段來挖掘網路的更深層次的信息。

在網路中,節點具有的連接數被稱作該節點的「度」。一個節點的度越大,它連接的其它節點也就越多,反之就越少。

度是網路中的一個很重要的概念,但它是局域的:它只能描述單個節點的性質。如果要考慮所有節點的性質,我們就必須做一個統計。

在我們的友誼網路中,每個節點代表一個人,節點的度就是這個人擁有多少個朋友。大多數人都會擁有4個朋友,沒有人會擁有超過4個朋友,但可以少於4個,有一些度為3、2、1的節點。前面我們說了,不考慮遊離的個人或者組織,因此度的分布會是這樣的:

這張度的分布直方圖就呈現了我們友誼網路的重要信息。當然,在這種簡單的例子中,度的分布可能不會比簡單的可視化帶給我們更多的信息量。但是在更加複雜的網路中,它往往能發揮更加強大的作用。

讓我們離開剛剛那個城市,進入一個新的城市。在這座城市中的友誼有一個新的規律:友誼是隨機發生的。也就是說,這個城市一開始沒有友誼連接,每個人都是孤立的節點,然後在所有可能的連接中隨機挑選一條,變成真的連接,然後隨著時間的推移不斷重複和發展,友誼網路變得越來越複雜。

這樣的友誼會是什麼樣子?可能會像下面這樣:

這樣的表示恐怕很難看清背後的本質,但如果我們研究它的度的分布,就能得到一些有用的信息。儘管直接計算並不容易,我們可以通過一個小小的例子簡單推演一下。

假設這座城市只有10個人,你是其中之一,那麼運用高中組合數學的知識,我們可以簡單地算出所有可能的友誼共有10×9÷2=45個,也就是說網路中最多有45條邊。

現在我們隨機地產生一個友誼,也就是從45條邊中隨意選擇一條把它畫上,那麼它與你有關的概率是多少?顯然,與你有關的邊一共有9條,因為你可能跟剩下的9個人分別產生友誼,所以與你有關的概率就是9÷45=20%。

這個結論適用於10個人中的每一個人,因此每個人都有20%的概率獲得新的友誼。當然,隨著友誼的增加,這個概率會有所變化,但是總的來說,每個節點獲得友誼的概率大致相同。這就意味著友誼將在這座城市裡均勻分布,幾乎每個人都會擁有接近平均數量的朋友。

這種熟悉的性質體現在典型隨機網路的二項式度分布中。

通過研究這種形式的度分布,我們會發現大多數節點的度是平均的,只有個別節點會出現極大或極小的情況。這便是一條很重要的信息,而且當有新人進入時,分布可能會略有變化,但是這種一般性的特徵不會改變。

回到我們的現實生活中,上面的兩個例子都不是符合真實情況的友誼網路模型。人們可以擁有4個以上的朋友,並且也並不符合二項式度分布。那麼真實的友誼網路模型會是什麼樣的呢?

當你和朋友或者朋友的朋友建立聯繫時,你們的友誼網路可能會分享現實世界其它網路的功能,例如食物網、蛋白質網、互聯網,等等。這些網路通常都是所謂的「無標度網路」——這是一種在過去20年中主導網路科學的連通模型,數學、物理學、經濟學、生物學、社會科學等領域的研究人員都在各自的領域觀察到了無標度網路的現象。

一個複雜的無標度網路,來源於某社交網路的元數據。Martin Grandjean

無標度網路的原則非常簡單——優先連接。它不同於前面我們提到的簡單的隨機網路,具有更多連接的節點獲得新連接的概率更大,換句話說就是強者愈強的馬太效應。

這種無標度網路模型對應到友誼網路中是否合理呢?我們來想一下,生活中,朋友越多的人,認識新朋友的概率也就越高,符合我們的常識。

雖然在無標度網路的發展中有很多因素在共同起著作用,但是大多數科學家還是認為「優先連接」的原則是最為根本的,它對網路的度分布有著非常大的影響:

從圖中我們可以看出,優先連接的原則意味著度的長尾分布。網路中大多數節點的度都很低,但是會有個別節點擁有非常高的度。這和前面我們假設的兩個模型截然不同。

這些度很高的節點,就像集線器一樣,是無標度網路的關鍵特徵。他們是友誼網路中的「交際花」,是經濟中心的銀行,是互聯網的核心交換機房……這些節點的存在,會讓我們有一種「世界很小」的錯覺。例如,在Facebook的20億用戶中隨機選擇2個,他們平均可以通過不超過4個朋友建立聯繫。並且它們還具有抵禦網路風險的能力,少數節點的崩潰不影響整體網路的通暢。

儘管無標度網路的研究與應用得到了大量的認可,但並不代表沒有任何爭議。這些度分布的精確數學特徵可能就難以解釋。網路科學先驅、物理學家Albert-László Barabási在他的著作《連接:新網路科學》一書中指出,表現出優先連接性質的網路將遵循冪律形式的度分布。冪律分布在很多物理模型中很常見,例如萬有引力定律和庫侖定律,它們都可以表示成f(x)=axk的形式,圖像如下所示:

冪律分布確實有一條長長的尾巴,但是這真的符合實際嗎?今年早些時候發表的一項研究分析了1000個真實世界的網路,發現只有三分之一的分布可以通過冪律分布很好的描述。很多的網路可以用指數分布和對數正態分布來更準確地描述,它們可能具有無標度網路的高級特徵,但是度分布不一致,它們真的可以被看作是無標度分布嗎?這真的很重要嗎?

如果我們希望將理論和數據聯繫起來,這一點就很重要。但優先連接原則真的是無標度網路形成的主要因素嗎?還是說有其它的因素也起著重要的作用,這些因素導致了不同的度分布?要回答這些問題,並找出接下來要問的正確問題,是充分理解網路的性質與結構、網路如何發展和演化的很重要的一部分。

並且,爭議也在提醒著我們,就像我們的網路一樣,數學本身也是一系列不斷發展的聯繫。在網路科學這樣一個年輕的研究領域,當前的研究也在不斷地挑戰著20年前的猜想。當新的想法加入到網路之中,它們將我們所有人與數學的過去和未來相連接。所以研究數學就像是發展友誼一樣,需要我們找到連接最多最核心的節點,通過它們來最大化你的「度」。

原文鏈接:

quantamagazine.org/how-

推薦閱讀:

What ?數數也要遵循「四項基本原則」
數學學習三大階段
家庭數感培養 Part 3

TAG:數學學習 | Facebook |