標籤:

台大林軒田機器學習課第卅二講筆記:結束曲

本講從特徵變換、最優化和避免過擬合這三個角度回顧了第17到32講講過的內容,並在最後給出了台大隊在過去幾次KDD Cup中的做法

詳細內容戳我


到此為止,林軒田老師所有32講關於機器學習課程的筆記已經連載完畢。回望過去,感慨良多

2015年,我曾經在Coursera上註冊過「機器學習基石」(對應於前16講)第二期的課程,以及「機器學習技法」(對應於後16講)第一期的課程。彼時,我剛參加工作不久,工作內容和機器學習還不相關,甚至也沒有太多寫代碼的事情,周圍同事對這個內容也不太感興趣,大家還是忙於自己的事業。而我當時雖然有一直從事演算法工作的願望,卻還缺乏足夠的熱情和勇氣。儘管下班以後從10點開始能堅持看一兩講課程,但是由於自身數學底子的薄弱,我並不能完全理解老師所講的全部內容(實事求是地說,只能大概了解基本原理,細節當時就沒有學會,以至於這次重新回顧之前已經忘記了)。而且由於自身的惰性,我也沒有投入太多的精力去鑽研其中的原理。更糟的是,由於編程水平的退步,我當時並不能很好地完成作業,只能靠一些取巧的方法勉強過關。雖然按照最後的課程成績我能拿到一份免費的「通過證書」(似乎技法課拿到了「優秀證書」,不過我忘記了),但是我每次看到這份記錄,感受到的並不是學到東西的欣慰,而是一種遺憾——尤其是Coursera改版,這門課程短期內不會再重新上線以後,這種失落感被進一步放大了(現在Coursera上可以搜到基石(上)的課程,涵蓋前8講,但是後24講何時能上線仍未可知)

後來,因為一些環境原因,我決定辭職,找一份演算法工程師的工作。感謝我一位年長很多的師兄的幫助,使得我最終如願。一年多里,在工作中,我學到了很多。再加上與老友,數學系科班出身的 @咲神 久別重逢,使得我總算是可以找到了一起並肩戰鬥的夥伴,也終於可以找到一個耐心的牛人能不厭其煩地解答我一些很幼稚的數學問題了,於是我一直計劃能有機會把我未曾真正得到的東西抓在手裡。正巧在大概7、8月份的時候,微博上的「愛可可-愛生活」老師將林老師的課程視頻搬運到了B站,我決定趕緊抓住這個機會。而且回望過去,儘管我上過很多公開課,但是筆記記得並不好,給之後複習造成了很大的困難(比如本專欄前面連載過的EdX哥倫比亞機器學習課程,就顯得簡單。自己做的CS224d 2017 Winter的課程也是如此。至於第一次聽林老師課時候做的筆記,那種類似塗鴉的東西不提也罷)。所以我這次聽課,決定寫一份盡量完整的筆記,類似與國外課程中lecture notes的那種,並且逼自己重新把8次作業做一遍(這也是為什麼筆記總是有一周多不更新的原因)

經過三個月的堅持,這件事情終於做成了,也使得我終於抬起頭直面這門課程,有底氣說我真正地學過了它(儘管由於年齡原因,可能有些東西又會忘記,所以還是得勤複習)。更讓我欣慰的還有兩點:其一就是經過快兩年的磨鍊,能看到自己在理論基礎和編程能力上的進步,其二就是,自從接觸了MOOC以後,我最大的感觸是,求學道路上,「萬事開頭難」並不再普適,開始做一件事,或者決心做一件事,已經易如反掌。真正警醒我的,是那句「靡不有初,鮮克有終」。希望這句話能一直鞭策我,在之後的學習道路上砥礪前行

儘管這一講的題目叫做「結束曲」,但是它只是這次課的結束,而結束往往預示著新的開始。在此我準備在休息一段時間之後開始一個新的計劃,which將寫在一篇新的文章里:)

Enjoy learning!


推薦閱讀:

機器學習基礎與實踐(二)----數據轉換
線性支持向量機(soft-margin SVM)
基於不平衡樣本的推薦演算法研究
從建立清晰的步驟開始——Machine Learning Project Checklist
【精品】12條核心知識帶你了解機器學習

TAG:機器學習 |