機械男到tfboy的歷程

機械男到tfboy的歷程

5 人贊了文章

前些天回答了一個關於機器學習,深度學習課程的問題,感覺很多人想進入這個領域。

我剛好是完全通過自學進入這個領域的,所以想寫篇文章來說說自己的歷程,希望可以幫助更多的人找到自己的路。

先說下我自己現在的情況,現在在國內某公司做演算法快兩年的時間,做過傳統的數據挖掘項目,也做過圖像的深度學習項目,最近在用深度學習處理時序數據,不算多厲害,但至少拿到一個相關的項目心裡不虛。

上面是我現在的情況,而我的背景是一個三流二本的機械男,我2013年的時候本科畢業,學校就不說了,現在身邊都是985,211畢業的碩士,我那點學歷真的拿不出手。2013~2016期間,我在一家重工業的外企呆了三年,所從事的工作和機器學習沒有任何關係。到了2016年初的時候,我剛剛談了大半年對象,也買了房子,經濟上的壓力使得我不得不開始考慮未來的路。

我在大學剛畢業的時候就一直關注類似36氪這樣的科技媒體,剛好那時候阿爾法狗橫空出世讓我接觸到了「機器學習」這個詞。我想都沒想就準備開始搞這個,經過大約一個月業餘時間的信息搜索,我在2016年4月的時候從上家公司離職,我沒有找任何培訓班,用了三個月的時間,每天奔走於家和圖書館之間,每天就是看書。

因為大學學的機械而且又工作了三年,所以很多數學知識都忘了,那三個月我前面一半時間基本都在補數學,後來才開始看機器學習。

剛開始看的一些教程有吳恩達斯坦福大學的視頻,還有李航的那本《統計學習方法》,同時還要跟著學習python,那段時間還是很艱難的。那時候基本把那本《統計學習方法》80%的內容從頭到尾推了七八遍(不包括條件隨機場,沒看懂),吳恩達的講義也推了好幾遍。

第一次看支持向量機的時候真的想放棄了……

也跟著一本《機器學習實戰》實現了一些演算法,後來還看了一些神經網路的教程,有吳恩達的UFLDL,但那個裡面沒有CNN和RNN,CNN和RNN是我在淘寶上花了5塊錢買的一個視頻教程里學的(那個時候沒有那麼多學習資源,什麼CS231n這麼好的東西那時候都是沒有的)。

總之就是花了三個月的時候惡補了很多之後,我開始大搖大擺的找工作了,當時的技能僅限於一點python和一些機器學習,深度學習理論。現實是很殘酷的,由於我是南京人,所以我只投了南京的公司,剛開始的半個月幾乎每天都投了十幾封簡歷,全部都石沉大海。一直過了一個月左右,才開始有面試的機會,那個時候我還是很浮躁的,四個月沒工作了,而且還要還貸款,我甚至都準備了兩份簡歷,一份是機器學習的,一份是機械的,實在轉不了行就還是干機械吧。

最終我面試了五家公司,有兩家願意給我個試用的機會,還有一家給我郵件發了個文本分類的數據集,讓我自己去搞,搞好了發過去再談。兩家給我試用機會的,有一家的研發中心在北京,我去不了,於是就留在了另外一家公司一直干到現在。至於讓我做題目的那家,因為在我做完那個文本分類前,就已經收到了offer,我也就沒有回復他(不過題目做好了)。

也就是說,我從一家工廠辭職後,一共花了四個半月的時間才找到工作。我覺得我的運氣很好,那時候機器學習真的是才剛剛起步,市場上很缺人,才讓我有機會鑽了空子進入這個領域。

現在我工作了一年多快兩年了,期間做了一些天池的比賽,也做了自己公司實際的項目,自我感覺比當初找工作時不知道強了多少倍,GBDT,隨機森林,xgboost,各種CNN,RNN,attention,最喜歡用pandas和matplotlib最數據分析,tensorflow從數據載入到最後的serving全流程打通,感覺棒極了。

但我得承認一件事,由於所在部門的原因,我所做的項目比較雜,有傳統數據挖掘,有圖像,也有時序數據,所以我這一年多的時間並沒有深入某個領域,比如nlp,但我自己的實際感受是,無論是哪個領域,只要是數據驅動的技術,對數據的理解都是很重要的,這一點是相通的,這點也是實戰後才有的切身體會。理論上推導起來再牛逼的演算法,在垃圾數據面前也是沒用的,這垃圾數據並不是說數據本來就一定是垃圾,也有可能是你自己對數據的理解不夠,給模型輸入了垃圾的特徵導致的。

總之,連我這麼個學歷低,學校一般,專業不對口的24K純屌都在ML&DL領域堅持到了今天,希望我的這段歷程能鼓勵到正在這條路上尋找方向的你。

另外最近還在學習強化學習的內容,keep running~

其實,感覺還有很多想說的,但時間也不早了,所以就到這吧,後面想結合自己的實際項目經驗寫一些總結性的文章。

推薦閱讀:

為什麼要使用向量化?(從時間上看)
矩陣乘法
機器學習筆記(3) - 邏輯回歸
菜鳥學tensorflow.2
SVM Kernel

TAG:深度學習DeepLearning | 機器學習 |