有沒有一鍵式的、傻瓜式的深度學習工具?如果有,是哪個?
目前,有沒有黑箱式的深度學習工具?或者叫做基於深度學習的人工智慧系統/軟體/工具?
比如手頭有一堆圖片要識別,下載一個這樣的程序,輸入圖片存放路徑,等待之後,輸出識別好的圖片。
有沒有類似的軟體呢?如果有,是什麼?如果沒有,為什麼?
首先回答,如果針對特定需求,比如只是要從圖片中識別常見類型的物體,對識別精度和速度也沒有非常高的要求,可以。 但總體來說,機器學習/深度學習都是一個需要根據特定需求和場景進行數據處理、特徵工程、演算法選擇、參數調整的,沒有傻瓜式的工具。
就題主說的圖片識別需求,因為CNN的特點是端到端的學習,無需人工提取特徵。常見類型的物體檢測和識別也有預訓練好的模型。唯一的障礙是深度學習框架的學習成本。
如果你沒有深度學習框架(如Tensorflow/Pytorch/Caffe)的使用經驗,可以使用Yolo。簡單的3步即可用來識別輸入圖片中的的常見20類(詳細類別見VOC)物體。
Step 1: 下載源碼編譯
git clone https://github.com/pjreddie/darknet
cd darknet
make
在linux下運行上述命令安裝好了,詳細安裝使用說明參考 Installing Darknet
Step 2: 下載訓練好的模型
wget https://pjreddie.com/media/files/yolo.weights
Step 3: 運行
./darknet detect cfg/yolo.cfg yolo.weights data/dog.jpg
其中 `yolo.weights` 是Step 2中下載的模型, `data/dog.jpg`是待識別的圖片。
識別結果會保存在 `predictions.jpg`中,結果如下圖:
------ update 2017.09.24 23:54 ------
@牛亮 在評論里提到YOLO對於新安裝的系統也可能沒有那麼順利,Tensorflow可能更方便。個人覺得如果編譯沒有問題,YOLO更容易點。但TF Object Detection也是一個好的選擇。使用TF Object Detection的一個額外好處是預訓練的模型多,可以用不同的模型來比較效果。
@何之源 之前發了一篇對TF Object Detection的科普貼 ,5步可以在Jupyter Notebook里跑出結果,也引用在這供參考。如果需要獨立批量運行,可將Notebook保存為.py文件,修改少量代碼即可。
推薦一下 nvidia digits
intel deeplearning sdk
如果有錢,我建議來氪萬能的 Mathematica:ImageIdentify - Wolfram Language Documentation
其實樓主需要的只是圖像分類任務的預訓練模型,但是他連環境都懶得配(逃)
一鍵估計還不行,得要四五鍵:
先裝好tensorflow 跟 opencv,然後https://github.com/KleinYuan/tf-object-detection我覺得caffe的可以
拿錢,我給你寫
「輸出識別好的圖片」,看你也是個行外人了。
難道不是應該說。。
「拿錢,我給你寫」嗎。。。。。
推薦閱讀:
※為什麼人類對倒置的熟悉人臉頭像沒有記憶和審美能力?
※自動售貨機是如何識別不同面額的紙幣的?
※sift演算法特徵點如何匹配?
※行為識別常用哪種特徵提取?
※OpenCV已經將圖像處理(識別)的演算法寫成函數了,那我們還有必要去學習這些演算法不?
TAG:人工智慧 | 語音識別 | 圖像識別 | 深度學習DeepLearning | Caffe深度學習框架 |