DeepTraffic：在線訓練AI開車

01-24

原文來自NVidia官方技術博客：DeepTraffic: How an MIT Simulation Game Uses Deep Learning to Reduce Gridlock

首發於集智專欄

翻譯： @Shikan Tatsuya

校對： @Kaiser

被堵在路上是個又喪又費錢的事兒，除了讓人頭疼還可能導致錯過約炮，交通堵塞使美國司機每年多花3000億。

研究人員認為即使是少數的自動駕駛車也將會大大改善交通流。 Lex Fridman和他在MIT的團隊創造了一個遊戲，來加速實現這個設想。

Deep Traffic模擬典型的高速公路環境，其玩家使用深度學習來控制自己的汽車。該模擬使初學者對複雜的技術概念易於上手，而遊戲化推動了專家開發全新的技術。

使用神經網路的交通模擬遊戲

想像你在洛杉磯一個繁忙的高速公路上開車。您必須決定跟車距離，何時更換車道，以及如何在導航時避免撞到其他車輛。這就是所謂的路徑規劃。有了Deep Traffic，任何人都可以設計和訓練一個深度神經網路。

在上月於矽谷舉行的GPU技術大會上，Fridman談到了遊戲如何依賴強化學習。在強化學習這種方法里，當神經網路採取所需動作就會得到獎勵，由此方法實現人工智慧。通過反覆重複這些獎勵，網路學會了該如何做。

在這個遊戲中，神經網路控制著一條沿著繁忙的高速公路行駛的紅色汽車，目標是儘可能快地航行。初學者在瀏覽器中使用JavaScript來操縱參數並改變他們的駕駛行為。高玩通過OpenAI Gym進入DeepTraffic，並使用Python來訓練網路。

DeepTraffic最初是為Fridman在MIT教授的課程而設計。當課程內容和遊戲甫一向公眾開放，便受到廣泛歡迎。憑藉迄今已有的超過12,000份數據，DeepTraffic極具競爭力。用戶以他們自己的網路所能達到的最快速度，在排行榜上交鋒。

遊戲因競爭而有趣，但真實世界的風險要高得多。自動駕駛車輛必須規划出從一個點到另一個點的安全路徑。AI要求被給與一個艱難的駕駛任務。諸如DeepTraffic之類的教育工具有助於培養下一代AI開發人員以及改變汽車生態系統的平面解決方案。

DeepTraffic在線調試地址

想對深度學習有個系統了解？不妨關注我站新上線的課程：深度學習的理論基礎 - 集智課堂，可免費試聽。