AI、神經網路、機器學習、深度學習和大數據的核心知識備忘錄分享

在過去的幾個月里,我一直在收集AI相關知識,並整理成易於記憶的備忘錄。在這期間,我也和我的朋友、同事分享這些備忘錄,都反映不錯,所以我決定把這些知識組織一下,並分享出來。包括神經網路結構、機器學習、神經網路圖結構、Tensorflow基本概念、Pandas、Numpy、Python、Scikit - Learn、Scipy等核心知識。

1、神經網路結構整理

神經網路結構備忘錄

2、神經網路圖整理

神經網路圖整備忘錄

神經網路圖整備忘錄

神經網路圖整備忘錄

3、機器學習概述

機器學習概念備忘錄

4、機器學習庫:Scikit-learn 演算法

該機器學習概念備忘錄可以幫助我們找到需要解決的機器學習問題最難的部分。該流程圖將幫助我們,更深入地了解問題以及尋找如何解決問題。

Scikit-learn演算法備忘錄

5、Scikit-learn庫

Scikit-learn(以前稱為scikits.learn)是用Python編寫的免費軟體機器學習庫。它包括各種分類,回歸和聚類演算法,包括支持向量機,隨機森林,梯度上升,k-mean和DBSCAN,並且被設計為可以與Python數字和科學庫NumPy和SciPy進行交互操作。

Scikit-learn備忘錄

6、機器學習:演算法概念備忘錄

來自Microsoft Azure,此機器學習備忘錄可以幫助我們選擇適當的機器學習演算法去解決預測分析問題。首先,需要了解的數據本質,然後找到最適合解決該問題的演算法。

機器學習演算法備忘錄

7、數據科學Python

Python數據科學備忘錄

大數據備忘錄

8、TensorFlow

2017年5月,Google宣布推出第二代TPU,同時TPU可以在Google Compute Engine中使用。第二代TPU可以提供高達180 teraflops的性能,當組織成64個TPU的構成集群時,可以提供高達11.5 petaflops的性能。

TesorFlow備忘錄

9、Keras

在2017年,Google的TensorFlow團隊決定在TensorFlow的核心庫中支持Keras。Chollet解釋說,Keras被認為是一個介面,而不是一個端到端的機器學習框架。它提供了更高級別,更直觀的抽象集合,使得無論後端科學計算庫是什麼,都可以輕鬆配置神經網路。

keras備忘錄

10、NumPy

NumPy是針對Python的CPython為參考實現的,Python是一個非優化的位元組碼解釋器。使用Python編寫的數學演算法的運行速度要比編譯的生成的數學演算法的運行效運算慢很多。NumPy通過提供多維數組、函數、運算符來解決python的低效問題,需要重寫一些代碼,主要是使用NumPy的內部循環。

Numpy備忘錄

11、Pandas

「Pandas」這個名稱來源於「panel data」一詞,一個用於多維結構化數據集的計量經濟學術語。

Pandas備忘錄

12、Data Wrangling

Data Wrangling是一款比較好的數據清洗軟體。

Data Wrangling備忘錄

Pandas Data Wrangling備忘錄

13、Data Wrangling與dplyr和tidyr結合

Data Wrangling 與dplyr和tidyr結合備忘錄

Data Wrangling 與dplyr和tidyr結合備忘錄

13、SciPy

SciPy是建立在NumPy數組對象基礎上,是NumPy工具集的一部分,這一工具集還包括Matplotlib,pandas和SymPy等工具,以及擴展的科學計算庫集。該NumPy工具集與其他應用程序(如MATLAB,GNU Octave和Scilab)具有類似的用戶。NumPy工具集有時也被稱為SciPy工具集。

Scipy備忘錄

14、Matplotlib

matplotlib是一個用於Python和Numpy的繪圖庫。matplotlib提供了一個面向對象的API,用於嵌入到一些通用的GUI工具包中使用,如Tkinter、wxPython、QT、GTK +。還有一個基於狀態機(如OpenGL)的程序「pylab」介面,設計成與MATLAB非常相似,但並不鼓勵使用它。SciPy中使用matplotlib。

pyplot是一個matplotlib模塊,它提供了一個類似MATLAB的界面。matplotlib被設計為與MATLAB類似,可以使用Python,最大優勢是免費。

Matplotlib備忘錄

15、數據可視化

數據可視化備忘錄

ggplot備忘錄

16、PySpark

Pyspark備忘錄

往期精彩內容推薦:

字元識別(OCR)相關工具/庫/教材/論文等資源整理

模型匯總23 - 卷積神經網路中不同類型的卷積方式介紹

斯坦福大學2017年-Spring-最新強化學習(Reinforcement Learning)課程分享

深度學習(AI)在醫療領域應用、需求及未來發展概述

模型匯總22 機器學習相關基礎數學理論、概念、模型思維導圖分享

深度學習在自然語言處理中的應用綜述

深度學習/機器學習的處理器列表(最全_中文版)

Andrew NG深度學習專業化課程介紹

模型匯總20-TACOTRON一種端到端的Text-to-Speech合成模型

CVPR—2017會議全套視頻下載地址分享

模型匯總18 強化學習(Reinforcement Learning)基礎介紹

純乾貨10 強化學習視頻教程分享(從入門到精通)

純乾貨7 Domain Adaptation視頻教程(附PPT)及經典論文分享

資源獨立下載地址:鏈接: pan.baidu.com/s/1cg1HFK 密碼: vrj8


推薦閱讀:

分散式機器學習里的 數據並行 和 模型並行 各是什麼意思?
有沒有國內寫的比較好的、深入淺出的、並且貼近實戰的機器學習與深度學習書籍或博客?
有基於spark的parameter server嗎?

TAG:深度学习DeepLearning | 机器学习 | 大规模机器学习 |