機器學習很枯燥,不想繼續學了怎麼辦?或許,這些建議值得一看
本文介紹的是我在機器學習方面的 實際經歷,想以此給大家提供些建議與思路,供各位參考。
希望通過一些途徑,來提高機器學習的興趣:(1)參與打卡活動:45天機器學習實戰(2)加入專門的微信群(3)建立機器學習的Github項目倉庫
1 書籍閱讀
過去一個月時間裡,我主要在看《機器學習實戰》(Machine Learning in Action)這本書,作者為 Peter Harrington。
在開始閱讀這本書之前,做了一個簡單的閱讀計劃,預計花 35天 左右的時間,自己看一遍這本書,比較有系統的學習下機器學習的相關演算法原理。
計劃表格 的格式如下:
圖2:
實際完成情況 如下:
圖3:
雖然有些章節有些延遲,但總體上還是按時完成了本書的閱讀。 當然,書中還有許多疑問,有待後續繼續深入了解。
2 一些感悟
通過這一段時間的堅持學習,有一些感悟,跟大家分享下。
1) 目標明確
在開始之前,先思考下自己的主要目的,想通過閱讀本書來獲得哪些收穫。
對於我來說,最主要的是 知道機器學習的大概框架結構,知曉有那些主要的演算法以及演算法的分類和應用場景, 以及以後深入研究相關內容需要的背景知識。
2) 計劃清晰
在開始之前,最好制定一個較為詳細的計劃。
通過實踐,針對計劃 有幾點感悟:
- (a)各個章節計劃的時間分配要較為合理,最好將整個書籍分為幾個大的模塊,在每個模塊之間,建議預留出一些時間來機動協調,或者作為階段性總結。
- (b)對個人的時間要有一個大概的判斷,比如是否有休假、出差、參加會議等,對於已工作的同學來說,公司可能會有一些偶然性的事件,會佔用個人的時間,從而打亂該計劃。
從我此次的實踐來看,
- (a)覺得時間安排總體偏緊湊,預留機動時間不多,某一個章節沒有按時完成,會導致後續章節連續不能按時完成。
- (b)計劃時間較為理想,實際上多了幾次出差,計劃時間稍微有些錯亂。
Anyway,計劃制定之時,可能不會考慮那麼全面,關鍵是個人要能夠靈活的調整與處理。
3) 堅持、堅持、再堅持
機器學習的閱讀,相關原理的推導,確實看起來會比較枯燥,由於一些基本原理可能不懂(比如:線性代數的矩陣運算或者某些統計學知識、亦或其他內容),經常會在某個問題或者代碼片段處就卡住了。
由於人的懶惰心理,會很容易堅持不下去。
這裡,提幾點個人的建議,或許對解決這種情況有好處:
- (a)在制定計劃時,可以考慮,如果完成計劃,給自己一些小獎勵作為激勵
- (b)尋找一些志同道合的人,共同來學習相同的內容,由於每個人的情況及知識背景不同,遇到的問題並不相同,有時候正好可以互相交流,在溝通中解決問題, 這樣可以更高效的學習。
3 一起來high:機器學習實戰
獨樂樂不如眾樂,一個人獨自學習不如大家一起共同學習。
本次以《機器學習實戰》(Machine Learning in Action)這本書為基礎,來進行學習。
書籍的內容目錄如圖3所示,各位童鞋可以通過該目錄來初步了解自己是否需要開始機器學習相關的內容。
建議大家購買該書籍,當然,網上也可以查找到相關資料。
當然,後續可以拓展其他機器學習相關的內容。
因此,我萌生了建立一個共同學習的想法,希望能通過一些途徑來實現。
1)打卡活動:45天機器學習實戰
建立一個 45天機器學習實戰 的打卡活動,通過打卡的形式來提醒自己學習,同時也了解其他同學的學習進度情況。
45天,是我設定的打卡時間,當然,這只是一個大致的時間,各位可以根據自己的實際情況進行調整學習計劃。
不管多少天,必須要設定一個明確的時間段,以便清楚的知道自己的任務計劃,使之具有可操作性和針對性。
歡迎大家參與,長按識別下面小程序,就可以參與到打卡活動中。(掃描下圖二維碼也可以)
註:該45天的時間計劃主要針對已工作人士,自由職業或者其他時間充裕的同學可以自己斟酌。
當然,關於打卡活動,如果自己覺得,可以依據自己的計劃執行,並且能持續堅持,也不一定要參加打卡活動。
主要的是能夠自我約束,能堅持完成計劃,形式可以多樣。
2)建立機器學習群
新建立專門的 機器學習微信群,學習過程中可能會遇到一些自己一時半會解決不了的問題,如果能通過各位同學的相互溝通,及時有效的解決,那敢情相當好~~
該微信群旨在提供一個專用的溝通平台,各位同學可以進行充分的溝通。
加入45天機器學習實戰打卡活動的同學可以加入微信群,入群方式會在上述打卡活動的小程序中告知。
提醒:
(1)由於微信群人數有限,目前不能預估後續會有多少同學想加入微信群。故加入微信群實行 先到先得 的原則。
(2)疏於打卡的同學,會在微信群人員滿群後優先淘汰出群。
3)建立Github項目倉庫
建立一個專門 Github項目倉庫,來針對遇到的典型問題進行匯總,方便自己回顧,以及其他後續進來學習的同學進行查看。
各位同學在學習的時候,可以把自己想分享的內容以 Issues 或 Pull requests的形式,發送到項目倉庫。
機器學習實戰-Github地址: https://github.com/liyangbit/pydataroad-machine-learning
由於微信群比較碎片化,有些內容查看起來不方便,覺得還是在github上記錄和總結會比較方便。
當然,微信群的優點是能夠便捷、及時的進行交流,確實是一個很好的溝通的途徑。
關於Github的使用,如果不熟悉,個人覺得可以百度一下,或者看下慕課網的視頻:版本控制入門 – 搬進 Github,http://www.imooc.com/learn/390
在微信公眾號中,也會考慮發布相關內容。
關於 計劃表格,如果大家也想制定類似的計劃,這裡提供我使用的模版供大家參考,一併放在github上。
總之,歡迎大家參與到機器學習中來,希望能共同學習,一起交流。
如果您覺得我的建議還不錯,歡迎推薦給您的朋友!
同時,歡迎關注公眾號「Python數據之道」(ID:PyDataRoad)
推薦閱讀:
※91 job interview questions for data scientists
※初入數據科學職業時,要避免的9個錯誤
※簡明數據科學 Part1:原理與過程
※PyCharm:2017.3版即將新增科學計算模式,預覽版現在可以下載使用