DeepTraffic:在線訓練AI開車
原文來自NVidia官方技術博客:DeepTraffic: How an MIT Simulation Game Uses Deep Learning to Reduce Gridlock
首發於集智專欄
翻譯: @Shikan Tatsuya
校對: @Kaiser
被堵在路上是個又喪又費錢的事兒,除了讓人頭疼還可能導致錯過約炮,交通堵塞使美國司機每年多花3000億。
研究人員認為即使是少數的自動駕駛車也將會大大改善交通流。 Lex Fridman和他在MIT的團隊創造了一個遊戲,來加速實現這個設想。
Deep Traffic模擬典型的高速公路環境,其玩家使用深度學習來控制自己的汽車。該模擬使初學者對複雜的技術概念易於上手,而遊戲化推動了專家開發全新的技術。
使用神經網路的交通模擬遊戲
想像你在洛杉磯一個繁忙的高速公路上開車。您必須決定跟車距離,何時更換車道,以及如何在導航時避免撞到其他車輛。這就是所謂的路徑規劃。 有了Deep Traffic,任何人都可以設計和訓練一個深度神經網路。
在上月於矽谷舉行的GPU技術大會上,Fridman談到了遊戲如何依賴強化學習。在強化學習這種方法里,當神經網路採取所需動作就會得到獎勵,由此方法實現人工智慧。通過反覆重複這些獎勵,網路學會了該如何做。
在這個遊戲中,神經網路控制著一條沿著繁忙的高速公路行駛的紅色汽車,目標是儘可能快地航行。初學者在瀏覽器中使用JavaScript來操縱參數並改變他們的駕駛行為。高玩通過OpenAI Gym進入DeepTraffic,並使用Python來訓練網路。
DeepTraffic最初是為Fridman在MIT教授的課程而設計。當課程內容和遊戲甫一向公眾開放,便受到廣泛歡迎。憑藉迄今已有的超過12,000份數據,DeepTraffic極具競爭力。用戶以他們自己的網路所能達到的最快速度,在排行榜上交鋒。
遊戲因競爭而有趣,但真實世界的風險要高得多。自動駕駛車輛必須規划出從一個點到另一個點的安全路徑。AI要求被給與一個艱難的駕駛任務。諸如DeepTraffic之類的教育工具有助於培養下一代AI開發人員以及改變汽車生態系統的平面解決方案。
DeepTraffic在線調試地址
想對深度學習有個系統了解?不妨關注我站新上線的課程:深度學習的理論基礎 - 集智課堂,可免費試聽。
推薦閱讀:
※怎麼評價中科大發布的中國首台特有體驗交互機器人?
※用人類自身的思維來完全理解自身,在邏輯上有沒有這種可能?
※從香農的老鼠到大數據
※如何成為一名全棧語音識別工程師?