Live :面向自動駕駛的計算機視覺 一 開篇

Live :面向自動駕駛的計算機視覺 一 開篇

來自專欄 V2AI4 人贊了文章

我終於在忙碌的工作之餘上線了這個 Live,本來是應該半個月前就發布的(笑

在本次 Live 是我該系列 「面向自動駕駛的計算機視覺」 的開篇,在本次 Live 中,我講詳細介紹視覺方面的基礎工作,包括卷積操作如何實現,幾乎是目前視覺方面繞不開的 Faster RCNN 的技術細節,以及關於自動駕駛領域的基礎介紹等。

自動駕駛的風口已經到來,相比於其他噱頭成分更多的風口,自動駕駛屬於以深度學習技術為核心,應用場景十分廣泛的一個領域。目前各大頂級車廠也都在同領域內的公司合作研發自己的自動駕駛方案,學術界也是如此,兩者的結合十分緊密。

作為自動駕駛三駕馬車 -- 感知,建模,決策 -- 之一的感知模塊,其核心就是計算機視覺的廣泛應用。在本系列的 Live 中,我們會了解到有關自動駕駛的視覺的方方面面。

作為該系列 Live 的開篇,本次 Live 的主要目標是打好基礎,未後續不同的專題鋪平道路。同時,也正因為這是開篇,本次 Live 中的大部分內容也適用於其他領域,比如安防等。

本次 Live 主要包括以下內容

1. 卷積神經網路基礎

- 組成結構

- 常見 Trick

- Implementation

2. 數據處理

- 2D 數據 / 3D 數據

- Augmentation

3. Faster RCNN

- 原理

- 何為 Anchor Box,RPN

- 應用場景泛化

4. 自動駕駛 Overview

- 標準 & 概覽

- KITTI Benchmark

- 接下來需要做什麼

------------------- 以下是預熱內容 -------------------------------

原文在此:Towards Autonomous Driving related Computer Vision - I

這是我繼《本科深度學習及求職經驗分享》後的第二個 Live,這次想聊點具體的技術問題,同時,我想把它作為我今年一個系列 Live

的開篇,關於計算機視覺和自動駕駛。一方面,為對這方面有興趣的同學提供一個 smoothly 入門以及深入的

path,另一方面,也是我在這個領域不斷學習和實踐的總結,這樣也可以讓各位可以 keep tracking of

state-of-the-art progress,當然,還有一方面是可以通過這一系列 Live 結交更多朋友。

這篇 blog 主要目的是幫我理清一下該系列第一個 Live 的思路,以及要講那些東西。

首先,做一下 」競品分析「,目前,知乎上可獲得的關於計算機視覺的 Live 有以下這些:

先看下人氣最高的第一個,是什麼內容:

我們有參加該

Live,從介紹來看,該 Live 講的比較適合零基礎入門的同學,不過也讓我感覺過於基礎,只是講了些常見的東西,換句話說,Live

中的內容,我猜測,基本都是可以自己通過搜索引擎獲取到的,比如公開課,參考書籍,開源軟體等等,這些在我看來,都屬於一個人會不會自學,會不會主動獲取知識,會不會快速的探索一個新領域的範疇,並沒有什麼技術含量。我當然沒有不尊重主講人的意思,畢竟,這個

Live 肯定做到了 」入門「 這一步,正如標題所說,不過如何 「放肆」,我就不得而知了。

by the way,買手機先去看差評,選 Live 差評也比好評的參考價值大很多。

另外幾個關於計算機視覺的 Live 我也大致看了下,通過參考已有的這些信息,我大致清楚了自己需要講那些東西。

首先,我們需要一個假設,我希望對這系列 Live 感興趣的你至少具備以下 」前提「,才能將收貨最大化:

  1. 你需要對編程有一定的了解,至少熟悉某一門編程語言,C++ 和 Python 最好,MATLAB 什麼的也可以。
  2. 你需要具備一定的數學基礎,基本大學學的這點數學就夠了,因為我想從最基礎的卷積操作講起,從而讓你對 CNN 有清晰地了解。
  3. 你需要對神經網路有一個初步的認識,如果你還不知道的話,推薦看一下多層感知機。

深度學習發展到現在,在

Vision 領域,有一些 「基礎性」 的工作是基本避不開的,比如 Faster-RCNN,ResNet,我打算在過段時間的第一個 Live

中,詳細的講一下 Faster RCNN,尤其是其中的 RPN 和 ROI Pooling 是如何工作的。

這個系列的 Live 面向的是自動駕駛,因此,我準備在第一次的 Live 中加入對常見的數據集的介紹,比如 KITTI,Pascal 3D,以及對其中常見的 Metric 的介紹

讓大家對自動駕駛中的常見任務有個整體的了解。

當然,還有一部分就是對目前自動駕駛(L1-L5)的現狀進行介紹了,包括有哪些公司做得比較好,國內國外分別有哪些,有哪幾種做自動駕駛的方式,以及目前的發展水平。

在本次 Live 之後,我目前的計劃是分一個個的專題進行深入的講解,時間不做限制,力求講得清楚,如果必要的話會伴隨一部分代碼。

如果你對此感興趣,或者有什麼期望在該系列 Live 里涉及到的,歡迎私信或者評論,我會及時對內容進行調整,我們到時候見。


推薦閱讀:

TAG:自動駕駛 | 計算機視覺 | 深度學習DeepLearning |