乾貨 | 機器學習數學、概念及模型思維導圖

02-18

機器學習是計算機科學的一個子領域，讓計算機能夠在沒有明確編碼的情況下自動進行學習。機器學習學科的目的是研究和構建一些可以讓機器自動從數據中學習和基於數據進行預測的演算法。

機器學習的範圍很廣泛，令人著迷。它跨越數學，計算機科學和神經科學的多個領域。

本文的目的主要是嘗試總結機器學習相關的一些「過程」、數據處理過程、數學理論和常用模型。

1、過程

數據科學不是一個設定然後遺忘的過程，而是一個需要設計、實現和維護的過程。

下面這張圖包含有關機器學習過程相關的內容，描述了機器學習數據準備、模型選擇、損失函數選擇、優化、參數調整和結果對比分析過程。

2、數據處理

首先，我們需要一些數據。數據處理包括尋找、收集、清理、還有其他操作等5個步驟。下圖展示了這些內容。

3、數學基礎

機器學習建立在數學基礎之上。下圖展示了機器學習相關的常見的數學基礎知識，可以參考，檢查你是否遺漏了某些知識點。

4、概念

下圖展示了機器學習相關的部分種類，類別，方式，庫和方法相關的概念，涉及線性代數、統計、概率、優化、正則、資訊理論、極大似然估計、分布和損失函數等方面。

5、模型

下圖列舉了一些機器學習常見的模型，主要介紹了神經網路和傳統機器去學習演算法兩部分。神經網路部分主要介紹輸入層、隱含層、權值初始化、反向傳播法、總結常用的激活函數（Relu，Sigmoid，Binary，Tanh，Softplus等）。傳統機器學習主要介紹一些分類、回歸、降維和基於貝葉斯和決策樹、和基於實例的機器學習演算法。