GitHub 上最火,最熱門的機器學習和人工智慧,數據科學項目

GitHub 上最火,最熱門的機器學習和人工智慧,數據科學項目

來自專欄非著名程序員

最近,普拉納夫 · 達爾(Pranav Dar)發文總結了 2018 年 2 月份 Github 上最火的 5 個數據科學和機器學習項目。

Pranav Dar,Analytics Vidhya 的編輯。數據可視化和六西格瑪從業者喜歡閱讀和深入研究數據科學和機器學習藝術。始終在尋找新的方法來改善使用 ML 和 AI 的流程。

1.FastPhotoStyle(快速轉換照片風格)

FastPhotoStyle 這個項目是英偉達(NVIDIA)開發的一個 Python 庫。該模型將內容照片和風格照片作為輸入。然後它將風格照片的風格轉移到內容照片,即就是將內容照片的風格轉換為我們輸入的風格照片的風格。

開發人員舉出了兩個演算法示例。首先,第一個是非常簡單的迭代演算法,只需要下載一張內容圖和風格圖,重新調整他們尺寸,然後運行圖像風格化代碼。第二個樣例中,需要使用語義標籤映射來創建程式化圖像。

2.Twitter Scraper(Twitter 爬蟲)

如果你在 Twitter 上發過文章,就知道 Twitter 自身的 API 有流速限制,當然,作為國內用戶大多數人都沒用使用過 Twitter ,這個 Python 庫就是考慮到這一點,它沒有 API 限流(不需要任何身份驗證),也沒有限制,並且速度非常快。開發人員可以用這個庫爬取任何用戶的任意一條 Twitter (推文)。

而且,這個項目可以用於製作馬爾科夫鏈,但是目前它只能適用於 Python 3.6 及以上版本。

3.Handwriting Synthesis(手寫體合成)

這個項目來自亞歷克斯 · 格雷夫斯(Alex Graves)撰寫的論文(Generating Sequences with Recurrent Neural Networks)《用 RNN 生成序列》,正如存儲庫的名稱所示,您可以生成不同風格的手寫,是其中手寫體合成實驗的實現,它可以生成不同風格的手寫字跡。模型包括初始化和偏置兩個部分,其中初始化控制樣例的風格,偏置控制樣例的整潔度。

作者在 GitHub 頁面上呈現的樣本的多樣性真的很吸引人。他正在尋找貢獻者來加強存儲庫,所以如果您有興趣,可以研究去看看。

4.ENAS PyTorch(高效神經網路結構搜索)

該項目是對論文《參數共享的高效神經網路結構搜索(Efficient Neural Architecture Search (ENAS) via Parameters Sharing)》的實現。ENAS 做什麼?高效神經網路結構搜索,即 ENAS 減少了計算需求,將 NAS 的 GPU 計算時間減少了 1000 倍。他們通過共享大型計算圖中的子圖模型之間的參數共享來完成此操作。

如何使用它的過程已經在 GitHub 頁面上得到了很好的展示。實現這個庫的先決條件是:

  • Python 3.6+
  • 需要 PyTorch
  • tqdm,imageio,graphviz,tqdm,tensorboardX

5.Sign Language(手勢語言識別)

這是一個相對簡單但又十分吸引人的機器學習項目。在 Python 中使用卷積神經網路構造模型,可以識別手勢並將其轉換為機器上的文本。

該項目存儲庫的作者用 Tensorflow 和 Keras 共同搭建了 CNN 模型,他特別詳細地說明了他是怎麼創建這個項目的,以及每一步是怎麼進行的。

是不是感覺非常不錯的,如果你對機器學習感興趣,可以去這些開源項目中去研究和學習一下。另外,通過這幾個開源項目,我們又一次了解了 Python 的重要性,所以,對於想學編程的讀者或者初入職場的計算機學生,可以往 Python 方向學習一下。

俗話說,一切分享不給開源項目地址的分享,都是偽分享,所以,上述五個開源項目的地址依次如下:

  1. github.com/NVIDIA/FastP
  2. github.com/kennethreitz
  3. github.com/sjvasquez/ha
  4. github.com/carpedm20/EN

EvilPort2/Sign-Language?

github.com圖標

文章首發於微信公眾號:非著名程序員,關注我,每天與 10 萬開發者共同進步,你離成功,只差一個關注。

推薦閱讀:

BP神經網路演算法:將參數矩陣向量化
【重磅】吳恩達最新的機器學習書籍更新啦!
pytorch實現capsule
嗨客案例 | 使用隨機森林進行紅酒品質分類
RNN Tutorial Part3 -- BPTT

TAG:人工智慧 | 機器學習 | 互聯網 |