使用計算機視覺方法做海洋瀕臨物種檢測

去年11月有相關的報道,谷歌用深度學習守衛海洋:如何在 4.5 萬張照片中找到一隻瀕危的「美人魚」? 今年TensorFlow-dev-summit中又提到了這個是利用tensorflow自動化構建的海洋生物系統,使用的是大量的高像素的無人機航拍圖片,然後在圖片中找出到了」海牛「這種瀕臨物種。

前幾天我看到了報道中的內容,然後提問了 用Tensorflow自動化構建海洋生物系統,利用上萬的圖片訓練,找到瀕臨物種「海牛」是什麼原理? - 人工智慧 - 知乎 ,後來經過回答者給出了該應用的相關論文《Automating Marine Mammal Detection in Aerial Images Captured During Wildlife Surveys: a Deep Learning Approach》,看了論文後發現,報道有誤導,因為報道中給出的圖片非常模糊,顯得識別的效果非常出人意料,但是在論文中使用的訓練數據和人工標註數據其實是非常高像素的無人機航拍圖片,如圖:

論文使用的方法其實也是非常常規的方法,而且主要也是有非常優質的數據,我們來看看。

1. 系統概述

首先使用Simple Linear Iterative Clustering (SLIC)做圖像分割,然後把每一個分割區塊看做一個region proposal,然後對候選窗口使用DCNN做one-hot分類。

2. SLIC參數設置

SLIC中最重要的一個參數設置就是把像素分類的個數,論文中設置的個數的計算方式為:

其中,w,h分別是整個畫面的寬和長,d是一個預測的每個bounding box的長,這個其實可以理解為就是」海牛「在畫面中的大小。

3. CNN結構

文中的CNN結構對比了兩種結構,

第一種是沒有使用maxout的結構:

第二種是使用了maxout的結構:

4. 實驗結果

準確度其實還不是很高,不過訓練還是挺快的,文中用GPU訓練,大概就訓練了半天,實際應用中,據說可以幫助解決80%的海牛檢測。

5. 延伸

[1]實驗數據的HDF5格式和python code

[2]另外一個關於bowhead whale的研究:《Trends in bowhead whales in West Greenland: Aerialnsurveys vs. genetic capture-recapture analyses》

---人工智慧應用系列·介紹---

本系列介紹各領域的一些有趣的人工智慧應用,原理可能並沒有那麼複雜,目的是開拓大家的視野和思路,也許人工智慧能做的事情比我們想像的還要多。

專欄地址:人工智慧應用系列 - 知乎專欄 (歡迎投稿和關注)

本人的Live:「跨領域人工智慧應用」系列Live的開篇--如何做跨領域人工智慧應用


推薦閱讀:

SiameseFC:Fully-Convolutional Siamese Networks for Object Tracking
[行為檢測]R-C3D-Resgion Convolutional 3D Network for Temporal Activity Detection
【OpenCV圖像處理】總緒論
10 大深度學習架構:計算機視覺優秀從業者必備(附代碼實現)
無人機避障的技術實現方式

TAG:人工智能 | 深度学习DeepLearning | 计算机视觉 |