標籤:

AI大事件 | 斯坦福初創公司發力AI硬體,DeepMind刪除神經元了解深度學習

嗚啦啦啦啦啦小夥伴們大家好呀!過去的一周中AI圈都發生了什麼?大佬們討論了哪些問題?研究者們發布了哪些值得一讀的論文?又有哪些開源的代碼和資料庫可以使用了?快快跟隨文摘菌盤點過去一周AI大事件!

新聞

Uber自動駕駛汽車在亞利桑那州發生致命事故

來源:WWW.THEGUARDIAN.COM

鏈接:

theguardian.com/technol

坦佩警方表示,Uber自動駕駛汽車在車禍發生時處於自動駕駛模式,被撞到的行人後來在醫院死亡。此次事件是第一起致命的自動駕駛汽車交通事故。

點擊查看大數據文摘相關報道:

  • Uber無人車發生全球首例行人致死事件,自動駕駛技術信度或倒退10年?

mp.weixin.qq.com/s?

  • Uber自動駕駛撞死行人視頻公布:無人車環境感知解決方案該如何優化?

mp.weixin.qq.com/s?

SambaNova System為AI硬體募集5600萬美元

來源:TECHCRUNCH.COM

鏈接:

techcrunch.com/2018/03/

這家初創公司由兩位斯坦福大學教授Kunle Olukotun和ChrisRé共同創立,並由前Oracle開發高級副總裁Rodrigo Liang領導。Olukotun和Liang不會涉及架構的細節,但他們正在試圖重新構建操作硬體,用來優化在圖像和語音識別等領域越來越流行的以AI為中心的框架。

TensorFlow 1.7.0 RC1發布

來源:GITHUB.COM

鏈接:

github.com/tensorflow/t

Eager Execution現在從contrib包移出到了Tensorflow的核心。其他更改包括更容易計算的自定義漸變,Tensorflow圖形調試器和SQLite數據集。

Skyline AI新融資$3M

來源:TECHCRUNCH.COM

鏈接:

techcrunch.com/2018/03/

Skyline AI是一家以色列的初創公司,使用機器學習幫助房地產投資者識別有潛力的房產。它日前宣布已經從紅杉資本籌集了300萬美元的種子資金。

文章&教程

隨機搜索VS Model-Free RL

來源:WWW.ARGMIN.NET

鏈接:

argmin.net/2018/03/20/m

簡單隨機搜索可以在MuJoCo等基準問題上超越強化學習演算法嗎? 答案是肯定的。

相應論文:

arxiv.org/abs/1803.0705

蒙特卡洛樹搜索初學者指南

來源:INT8.IO

鏈接:

int8.io/monte-carlo-tre

蒙特卡洛樹搜索(MCTS)的深入介紹,許多棋盤遊戲代理都使用這個演算法,包括國際象棋引擎和AlphaGo。其主要目的是在當前遊戲狀態下選擇下一個最優的行為。

機器學習重現性危機

來源:PETEWARDEN.COM

鏈接:

petewarden.com/2018/03/

在機器學習領域,重現往往很難。當涉及到跟蹤變化和重建模型時,整個領域仍處於黑暗時代。這篇文章列出了一些挑戰以及我們如何接近它們。

通過神經元刪除了解深度學習

來源:DEEPMIND.COM

鏈接:

deepmind.com/blog/under

DeepMind的一組研究人員通過刪除單個神經元以及神經元組來觀測這種操作對網路的性能影響。他們發現可解釋的神經元並不比難解釋活動的混淆神經元更重要,並且相比僅能對它們之前看到的圖像進行分類的網路,能夠正確分類看不見的圖像的網路對神經元刪除更具適應性。

代碼,項目&數據

強化學習大冒險:Pytorch Deep Q Learning教程

來源:GITHUB.COM

鏈接:

github.com/higgsfield/R

這個教程在PyTorch和Jupyter中實現了一系列深度Q學習演算法,其代碼清晰易讀。這個代碼庫是了解各種演算法之間差異的良好開始。

如何訓練神經核心模型

來源:MEDIUM.COM

鏈接:

medium.com/huggingface/

這篇文章將指導您了解Coherence解決方案系統的工作原理以及如何使用CoNLL 2012數據集進行訓練。完整的代碼在Github上可用。

PyTorch中的隨機加權平均

來源:GITHUB.COM

鏈接:

github.com/timgaripov/s

該文檔庫包含PyTorch實現的隨機加權平均(SWA)訓練方法,適用於DNN的訓練方法,包括平均權重導向Wider Optima和Better Generalization。

LabNotebook:監控機器學習實驗

來源:GITHUB.COM

鏈接:

github.com/henripal/lab

LabNotebook是一個純Python工具,允許使用者監控,記錄,保存和查詢所有的機器學習實驗。這個庫看起來很有潛力,但目前仍處於alpha版本狀態。

爆款論文

簡單的隨機搜索與強化學習的競爭

來源:ARXIV.ORG

鏈接:

arxiv.org/abs/1803.0705

作者介紹了一種隨機搜索方法,用於訓練連續控制問題的靜態線性策略,使基準MuJoCo運動任務的最新樣本效率相匹配。搜索演算法的效率至少比這些基準測試中最快的免競爭模型方法高15倍。

多尺度神經語言建模分析

來源:ARXIV.ORG

鏈接:

arxiv.org/abs/1803.0824

語言建模中的許多先進方法都引入了新穎,複雜和專業的體系結構。作者採用基於LSTM和QRNN的現有最先進的詞級語言模型,並將它們擴展到更大的辭彙表和字元級粒度。經過適當調整後,LSTM和QRNN分別在字元級別(Penn Treebank,enwik8)和單詞級別(WikiText-103)數據集上獲得了最新結果。使用單個現代GPU僅需12小時(WikiText-103)至2天(enwik8)即可獲得結果。

突擊深入強化學習

來源:ARXIV.ORG

鏈接:

arxiv.org/abs/1803.0383

作者使用以前訓練過的教師代理訓練新的學生代理。作者表示,在計算密集型多任務基準測試(DMLab-30)中,kickstarted訓練可提高新代理的數據效率,從而實現更快的迭代。同樣的啟動管道可以讓一個學生代理利用專門從事個人任務的多位「專家」教師。在這種情況下,kickstarted代理可以把從頭開始培訓的「學生」代理與幾乎減少10倍的步驟相匹配,並將其最終性能提升42%。


推薦閱讀:

你聽說過AI(人工智慧)音樂嗎?
全球首家幼兒AI學校在矽谷開業了,但……事情並沒有這麼簡單
有關AI的利弊,李開復真的說對了嗎?(芥子說物聯 第十二期)
解讀《淺談人工智慧:現狀、任務、構架與統一》·第一期
AI技術正以五種方式改變軟體測試工作

TAG:AI技術 |