機器學習工程實踐之一、引言
來自專欄保險科技與人工智慧5 人贊了文章
Mainly from Machine Learning Yearning By ANDREW NG
一、引言
1.1為什麼使用機器學習
機器學習是無數重要應用程序的基礎,包括Web搜索,電子郵件反垃圾郵件,語音識別,產品推薦等。 假設你正在開發機器學習應用程序,並且希望快速取得進展。 這本書將幫助你這樣做。
案例:建一個貓圖片創業公司。
假設你正在建立一個初創公司,為貓愛好者提供源源不斷的貓圖片。
如果使用神經網路構建計算機視覺系統,用於檢測圖片中的貓。但不幸的是,你的學習演算法的準確率還不夠好,因此正面臨著改善貓探測器的巨大壓力。你們該怎麼做?可能整個團隊有很多想法,例如:
?獲取更多數據:收集更多貓的照片。
?收集更多樣化的訓練集。例如,在不常見的地方的貓的照片;有不尋常顏色的貓的照片; 用各種相機設置拍攝的照片...
?通過運行梯度下降迭代更多次,來訓練演算法更長時間。
?嘗試更大的神經網路,具有更多層/隱藏單元/參數。
?嘗試更小的神經網路。
?嘗試添加正則項(例如L2正則項)。
?更改神經網路架構(激活功能,隱藏單元數等)
?......
如果做出正確的選擇,可以構建出領先的貓圖片平台,並引領公司走向成功。
如果選擇不好,可能會浪費好幾個月。你怎麼辦?本書將會告訴你怎麼辦。大多數機器學習問題都會有線索可循,告訴你嘗試什麼是有用的,什麼是無用的。學習分析這些線索可以節省數月或數年的開發時間。
推薦閱讀:
※集成學習-Boosting,Bagging與Stacking
※從Kaggle歷史數據看機器學習競賽趨勢
※NLP系列學習:意圖識別
※學界 | 北郵奪冠CVPR 2018 DeepGlobe比賽,他們是這樣做衛星圖像識別的
※Hulu機器學習問題與解答系列 | 十九:主題模型
TAG:機器學習 |