轉型之路的思考和體會
回顧了本專欄的第一篇文章,那也是我決定轉行的時候,到今年八月初找到工作,轉行成功,也正好半年時間。目前的工作非常符合我的期望,整個工作狀態比之前都好很多。這半年時間有努力,也有拖延,也有快要放棄的時候,不過還好都堅持下來了。換了一個城市,換了一個公司,換了行業,換了方向,重新開始。
隨著入門數據分析,也越來越堅定了我最初的選擇。之前從事雲計算相關的工作,雖然也是一個蓬勃發展的方向,但是我發現自己並不是很喜歡這種偏基礎設施類的技術,因為這類技術一般都會依附於一個大型團隊中,才能實現自己的價值,將來如果想自己做點事情,還是比較難的,相反,大數據分析在應用方面屬於較為上層的技術,與社會學,心理學,金融,以及個人決策等等都具有很密切的關係,而這正是我所喜歡的方向。
這段時間主要學習了概率統計學相關知識和R語言以及Kaggle上的一些實踐。概率統計學相關知識大學也學習過,但是當時也沒怎麼好好學,現在回過頭學這部分知識,感覺還是挺有意思的,我覺得學習概率統計,重點是在於理解,最好是能聯繫上現實生活或者工作內容。因為知識的本質也是前人將實踐的經驗進行總結和歸納以及抽象,提煉其規律。我們應該重點放在知識所能解決的實際問題上,能還原這個知識所遇到的問題場景,這樣能夠更深入地學習它。R語言是一個很好的解決概率統計相關問題的工具,以及可以將結果很好地可視化,這也是它的強勢之處。因為之前也是做技術的,所以學習新的語言,難度也不是很大,如果初學編程,也不用過分地糾結選擇哪種語言,因為當你學會第一門語言後,再學習其他的語言,學習成本就會很低,各語言的差別主要還是在應用場景上,在數據分析領域,R語言和python都是比較適合的。
八月初剛進入新公司,有太多的東西需要學習,這一兩個月也是非常忙碌,但是這段時間成長也是最快速的。剛入公司學習了幾天時間,就接到了一個新的產品功能點的任務,慢慢摸索爬蟲相關的技術,直到現在,系統已經爬取到了十萬級,快接近一百萬的數據,也是非常有成就感,由於數據量越來越大,數據所暴露出來的問題也越來越多,整個框架和代碼也暴露了一些問題,然後又進行了重構,現在也快重構完了,這段時間對系統的設計和產品的迭代開發也有了一些體會。項目剛開始是我一個人開始探路,到後期,隨著系統慢慢複雜,團隊其他成員也加入了,團隊之間如何高效地溝通也是非常重要的事情。由於項目時間緊,也鍛煉了我的時間規劃把控能力,首先要清晰自己的目標,以目標驅動,然後將大目標或者大任務進行分解,可以利用類似思維導圖一樣的工具,或者手寫也可以,然後逐步實現這些小任務,然後設立一些檢驗這些小任務是否完成的標誌,由於這一個個的里程碑式的小任務,會讓我們更清晰自己的路線,更快地到達終點,不然只會在起點處像個無頭蒼蠅一樣地左顧右盼,不知如何開始。
下一個半年,希望自己能在技術和業務上能有更大的提升,希望能和大家一起學習,共同進步,歡迎交流!
推薦閱讀:
※20170420 NumPy基礎:數組和矢量計算-3
※大數據·最新美帝UFO目擊事件可視化圖表
※[長篇小說]數據分析俠A的成長故事[2.26更]
※rvest包翻譯——利用R語言進行網頁抓取
※《R語言實戰》第6章 筆記