以複雜對抗複雜--機器學習vs複雜系統新書計劃

兩個月前,我進行了機器學習vs複雜系統的特訓課, 特訓課把非常熱門的機器學習和一個低調但威力無窮的基礎學科複雜系統聯繫在一起,給我們世界觀和方法論的一次洗禮。而新書將是對課程的一次系統性升華。 這本書的名字就是以複雜對抗複雜,副標題機器學習vs複雜系統。

現實生活中預測的根本難題在於無處不在的複雜性,比如股市,自然災害,長久的天氣預測,都很難做到精準。複雜系統幫助我們理解複雜性產生的根源,而機器學習讓我們利用數據最大可能的預測和掌控複雜。這本書內容涉及機器學習基本方法,非線性動力學,複雜系統,隨機過程,神經網路這些正在深刻的改變我們世界的學科。講述機器學習和複雜系統的基本原理和如何影響了我們日常生活的方方面面:小到微信里的語音識別,大到我們到底能不能預測經濟和金融危機。

核心內容圍繞機器學習和複雜系統指導下的預測和決策, 以及機器學習,複雜系統這兩門課程是如何幫助我們解決預測與決策,解決複雜問題的。

本書將由我和瑞東聯手完成,書目大綱是:

第一部分: 複雜世界的決策引言

1. 預測與決策引言- 預測是困難的,尤其是有關未來的

預測未知是巫師的魔法還是有跡可循?哪些預測比較簡單? 哪些比較難?

2. 物理學預測的勝利(動力學的世界觀),四大力學概述

物理預測問題的核心方法是什麼?四大力學是如何用數學攻克宏觀到微觀 的廣闊世界的?

3. 物理預測的失敗,為什麼物理預測會失敗

物理預測問題的核心方法是什麼?四大力學是如何用數學攻克宏觀到微觀 的廣闊世界的?

4. 預測會失敗,但模式無處不在

為什麼物理定律無法預測你的壽命,或明天大盤的走勢? 這些問題比量子力學還難?

第二部分: 複雜系統對抗複雜世界

複雜系統闡述模式的產生,生活中模式無處不在, 比如同類型的商店往往比鄰而居,分久必合合久必分 , 熱戀過後不是分手就是回歸平淡。 甚至那些我們不認為是模式的,比如生命過程本身,其實都可以看做自然界中模式湧現的過程。 這些模式往往可以歸結為組成系統的個體通過簡單相互作用達到某種非同尋常的集體現象, 複雜系統用動力學的思想闡述這一過程的發生。

1. 複雜系統的世界觀

一個聯繫宏觀與微觀世界的橋樑學科, 是如何重塑我們世界觀的? 那些日常生活中的東西是複雜系統? 你會嚇一跳

2. 複雜網路與物理學

2.1 複雜系統與傳統物理

複雜系統起源於物理,尤其是固體物理的一些方法, 當微觀粒子的相互作用很弱,我們通常可以把系統分解為一個個小部分的和,當微觀粒子發生強關聯, 已有的物理還原思想很難適用,這時候我們需要非線性科學。

2.2 非線性動力學描述的世界

相互作用使得物理系統不再給可以輕鬆的由整體拆成部分理解-非線性即其根源, 我們還有什麼招來解決這個問題?

2.2 非線性動力學描述的世界

相互作用使得物理系統不再給可以輕鬆的由整體拆成部分理解-非線性即其根源, 我們還有什麼招來解決這個問題?

2.3 混沌與預測夢想的破滅

混沌說的是由於系統內自由維度的增加, 系統的動力學屬性不在歸於閉合軌道而是開放而不可預測的軌跡,初始條件的稍微變化在未來的影響遠未可知, 想想真是脊背發涼。

2.4 易辛模型

易辛模型講的是一種最簡單的集體模式生成的方法,是統計物理和複雜系統的交叉點, 它甚至可以預測大選選區或候鳥運動的模式

2.5 複雜系統與相變

所謂相關, 是某些條件系統的宏觀屬性在某些條件下發生躍變的而非連續的變化, 它的微觀源泉是什麼? 為什麼說相變點上一切皆有可能?

2.6 非平衡態物理的故事- 耗散系統

平衡是我們理解的物理體系的常態, 然而複雜系統卻往往處在非平衡的狀態下, 這時候 「流」 而非 「 形」 成為事物存在的本質,所謂耗散系統。

2.7 分形理論

分形,是自然界中複雜結構的範式,雲,山脈, 閃電,河流走向, 閃電都具有分形結構, 所謂一花一世界, 這其中的奧妙也藏在動力學的規律里。

2.8 複雜網路

複雜網路可以幫我們分析很多互聯網行為, 甚至文學小說。

3. 複雜系統視角下的經濟金融

3.1 複雜系統視角下的經濟學

經濟學簡直是一門複雜系統的應用學科,市場是什麼? 價格是怎麼形成的? 供求平衡真的存在嗎? 這些都可以用複雜系統的思維理解, 從此經濟學不是乾巴的兩條供求曲線 。

3.2 市場經濟的效率與不穩定性

市場的高效和穩定可以同時存在嗎 ? 經濟危機可以避免嗎? 如果人人都是理性人, 人人都有完全信息,是否市場波動可以消除?

3.3 複雜網路在產業升級中的應用- 國家與人技術升遷的啟示

一些國家能夠實現有效工業化,一些國家始終是能源或農業品提供國, 為什麼? 複雜網路給你一個全新的解釋, 並且告訴你的事業規劃該如何做起(說不定可以用這個idea開個創業公司) 。

3.4. 複雜系統視角下的股票市場

股票市場為什麼很難預測? 基本面分析為何常常不準? 股災能夠避免嗎? 複雜系統角度下, 股市是典型的複雜開放系統,信息流導致的相變可以成為理解股市的指導思想之一。

3.5 Agent Base Model 應用於交易市場

代理人模型是如何指導我們合理調控市場的?

3.6. 複雜系統里的哈耶克思想

如何用複雜系統指導我們理解哈耶克的經濟學?

3.7. 複雜系統視角談財富積累

如何用複雜系統思維指導我們積累財富? 保守主義和複雜系統思維的內在聯繫是什麼?

4. 複雜系統視角下的生命現象

4.1 生物是個複雜系統

生物是典型的複雜系統

4.2 湧現,圖靈斑紋與生命起源

如何用相變的思維去猜測生命起源的過程?

4.3 複雜系統談人生-人生之有序與混沌

如何用複雜系統的思維指導人生? 我們可以用高屋建瓴的思維看人生過程正是模式從無序的細節中湧現出來的過程。 而複雜系統可以讓我們懂得如何用進化的角度看事業路徑以及人的內在特點是如何被映射到他與世界的整個關係里的。 對人生創業都有指導。

4.4 . 複雜系統視角談路徑依賴

我們什麼時候該過說走就走的人生? 什麼時候該在決策中高度考慮過去的經歷? 沉沒成本到底該如何界定? 複雜系統視角下的路徑依賴將幫助你解答這些問題。

5 .複雜系統視角談反脆弱

尼古拉斯塔勒布的核心思想反脆弱其根基正是複雜系統, 如何從複雜系統的角度看我們如何從困境中變得更強大?

6.複雜系統下的決策, 分散式決策與區塊鏈

複雜系統也成為現代決策理論的基礎,對於一些特別複雜的問題, 分散式決策遠好於中央式,這一基本原理根植於複雜系統中, 而其最火應用正是區塊鏈技術。

7.複雜系統研究的基本方法- 開啟機器學習時代

複雜系統的研究方法包括模擬, 分析, 和數據挖掘, 目前這些方法已經被機器學習全面滲透。 用幾個示例描述這些是如何發生的。

第三部分: 機器學習對抗複雜系統

機器學習是一套從數據中發現模式的方法論, 複雜系統闡述模式的生成, 卻不能告訴我們在實際中如何發現模式 ,這一點正是機器學習可以做的。「機器」的含義是演算法,「學習」其實是「統計學習」的簡稱。機器學習是一套數學方法。 當機器學習尤其是其新近內核深度學習輔之以GPU並行運算這些技術, 它就成為計算機自動在數據中挖掘模式(有效信息)的利器, 所謂大數據和人工智慧的引擎。

事實上我們的大腦認知過程本身, 正是在大量隨機數據中發現模式。 而機器學習, 實則模擬人類學習。 這是複雜對抗複雜的最好詮釋,在書中將有闡述 。

機器學習幫助我們挖掘中複雜系統的模式, 而複雜系統的思維, 可以幫助我們設計機器學習的演算法。

1. 開發大數據的利刃-機器學習

    機器學習與大數據, 數據挖掘這些名詞的關聯是什麼? 大數據是如何在實際中應用的?

2. 機器學習的基礎-統計學習

2.1. 談談隨機性

    了解隨機性的數學表示, 如何在隨機的數據中學習掌握

2.2 統計學的兩大流派

    頻率學派和貝葉斯學派是統計學的兩大基本分支,以它們各自為基礎我們可以得到統計學習的不同表述, 此種意義博大精深。

2.3 貝葉斯分析

    信貝爺,得永生,貝葉斯分析那是妥妥的世界觀加方法論利器,承載了整個科學方法。 你真理解了感覺眼睛都明亮了。

2.4 貝葉斯決策與機器學習

    貝葉斯決策是什麼? 它的基本步驟一旦自動化,即得到大名鼎鼎的機器學習。

2.5 從樸素貝葉斯到貝葉斯網路

    貝爺是如何在實際的機器學習里應用的?這裡要知道兩個大神級方法,一個是樸素貝葉斯, 一個是貝葉斯網路。 貝葉斯網路可以處理需要複雜因果推理的場景,在醫學診斷中都很常見。

2.6 趣談: 貝葉斯框架下的人類大腦

    貝葉斯框架同樣可以用於理解我們的大腦。 如同之前說的, 機器學習其實是一種仿生。

3. 機器學習理論方法

此處討論機器學習的經典方法及在實際數據中的應用。

3.1. 有監督學習

3.1.1. 回歸問題

什麼,線性回歸也是機器學習的方法? 對, 而且線性回歸可以用到很高維的數據處理里,通過線性回歸了解機器學習的訓練和測試過程,

3.1.2 分類問題

a. 線性分類問題

b. SVM(支持向量機),初克非線性

支持向量機演算法能夠闡述升高維度的思路是如何解決非線性分類問題的。支持向量機本身就是以複雜對抗複雜的例子。

c.群體的智慧,ensemble learning,隨機森林演算法

隨機森林是二叉樹演算法的一個推廣, 它用很多的二叉樹來進行決策, 如同之前講過的分散式決策原理,我們將在再次看到複雜系統思想在機器學習中的現行,我們將再次理解以複雜對抗複雜。

3.2. 無監督學習

3.2.1 主成分析 - 降維思想

主成分析是重要的非監督學習方法,我們面對複雜性的第一件事,就是再複雜中尋找簡單, 主成分析即第一個可以嘗試的辦法。 以簡單對抗複雜依然是重要的思路。

3.2.2 聚類問題

主成分析是重要的非監督學習方法,在我們的數據繁複又缺乏有效標籤的時候, 聚類是簡化問題, 把數據分成幾個大類的有效方法。

3.3. 強化學習

分類和聚類為主的有監督和無監督學習解決預測問題,而強化學習更多有關決策,在強化學習中, 未來的結果是主體的行為法則和其外在環境互相作用,主體通過自身的決策影響未來,主體需要學習的是決策方法而非簡單預測。

3.3.1 馬爾科夫決策問題

馬爾科夫決策,此處可不是馬爾科夫鏈, 如果你要用一個最簡單的數學模型讓機器幫你決策,非它莫屬。

3.3.2 多臂老虎機-談探索與開採的平衡

賭博也是強化學習可以涉及的領域哦,你知道在玩多臂老虎機最重要的原則是什麼嗎? 探索新策略和使用既有策略獲利的平衡。

3.3.3 遺傳選擇演算法

遺傳演算法也是深度學習常用的方法。 此處又見複雜系統思維在機器學習演算法中的應用

3.4 深度學習

大名鼎鼎的深度學習

3.4.1 跨學科視角下的神經網路

神經網路是一個跨學科盛宴, 而不理解其背景就難以明白深度學習怎麼work的

3.4.2 梯度回傳演算法

3.4.3 神經網路為什work, 從神經編碼的底層機制說開去

神經網路深度學習能夠運作, 其實也是因為它和大腦神經編碼的機制相和, 是以複雜系統解決複雜系統的最大勝利。

4. 談談時間序列分析

4.1 隨機過程引論 -馬爾科夫鏈

馬爾科夫過程簡介

4.2 隱馬模型與EM演算法

你知道最簡單的預測天氣方法嗎?

4.3 時間序列與動力學系統

馬爾科夫過程是重要演算法

4.4 遞歸神經網路- 時間序列終結者

遞歸神經網路RNN,能夠學習任何時間序列里的模式, 如果這個模式存在, 為什麼? 此處與複雜系統篇的路徑依賴暗自相和。

5. 機器學習對抗複雜系統之生物應用篇

5.1 機器學習與腦科學

機器學習在了解大腦編碼機制的過程里, 算是原湯化原食。 無論RNN還是支持向量機,都可以幫我們了解大腦編碼的機制 。

5.2 機器學習的醫學應用

醫學數據具有因素複雜,數據量大, 模式驗證之後經濟效益巨大等特點, 簡直就是為機器學習專門設計的試驗場。

6.機器學習對抗複雜系統之金融市場

金融同醫學類似, 都是數據量巨大, 模式存在但難以發現, 而機器通過大量數據可以大量提高效率的場所。

6.1. 機器學習與交易模式

6.2. 機器學習偵測異常交易行為

6.3. 機器學習真的能預測股市嗎?

這個主題恐怕是大家最關心的。

7. 機器學習對抗複雜決策

7.1 AlphaGo中的機器學習決策原理

手把手教你Alphago是怎麼決策贏得人類最複雜的遊戲的。

7.2. 機器學習在企業決策中的應用(智能電網)

人工智慧在傳統工業應用的核心是提高效率。

8. 談談機器學習創業

之前說的大多是機器學習是什麼, 要是讓你用學過的知識做一個創業公司, 你想怎麼做?是此處希望拋磚引玉石指出機器學習如何做成一個生意。

新書預計春節前後完成初稿。 歡迎有識之士一起參與貢獻本書的寫作思路, 或者討論相關主題。 巡洋艦科技繼續搜索大數據和機器學習人才, 加盟機器學習社區或成為合伙人! (請加鐵哥新號ironcruiser)。


推薦閱讀:

TAG:复杂系统 | 机器学习 | 大数据 |