從現在開始-第一步
以往:今年二月份開始在一家it公司實習做產品助理,一直到六月份之前都是做著一些瑣碎的事情,但是轉機就在六月頭髮生了。我大學所學專業是信息資源管理,什麼東西都學一點,例如編程語言、需求分析、數據分析、項目管理……但在我理解裡面偏需求分析多一點,所以我感覺我以後可能偏向於產品需求這一方面吧。以前感覺自己好像做什麼都可以,準確來說當時我是一個沒有目標的人,找不到一個奮鬥的方向,想著自己還年輕,可以慢慢發現適合自己的路。接觸數據分析是在我大三的時候,學習spss這一個軟體的課程,但是當時對數據分析理解也不足夠,也只是跟著老師的步伐走,面對什麼樣的題用什麼樣的方法,完全就是一個應試教育的例子。數據都是少之又少,純手打也ok,資料庫?爬蟲?不存在的…雖然這一門課我學得糊裡糊塗,但是要是沒有它,我說不定就不會有接下來的事情。那就是…選畢設方向!迷一樣的我選了當時對於我來說也是迷一樣的數據分析。(我也不知道哪裡來的自信)
現在:看到猴子老師的文章時候我正在糾結畢業論文,有點兒痛苦卻又感覺對數據分析有點兒興趣,可能是慢慢了解到了數據分析的真正思路吧,通過數據去看世界真的很奇妙。就在兩個月前,我因為有一點(比同公司的人多一丟丟)數據分析的基礎,加入公司新接的(首個)大數據項目,然後接觸到一堆關於交通方面的龐大的數據,主要都是車輛、人員、定位等信息,亂七八糟的數據中卻有著道不清理還亂的聯繫。這兩個月來,幾乎一直都是在嘗試了解資料庫裡面的數據,還要從一堆資料庫、不同的系統中找出一絲絲聯繫,直到現在,感覺到很無力。然後想著,自己還是太弱小了,懂得的太少,所以想要通過學習,建立數據分析的思路,學會如何在龐大的數據中找出相互的聯繫,當然,這只是面向現在的短暫性目標,以後還要學習Excel應用、數據可視化、Python語言等。
未來:我給自己的未來定位是:業務數據分析師,也就是產品+數據分析。就目前來說,參與的項目是交通方面的項目,按公司規劃未來可能不只是這一個,還會有其他關於交通大數據的項目,所以在學習階段中,我利用現有的基礎數據來實踐學習內容,所以暫定是交通行業的數據分析師。
根據第一關的作業要求,我利用集搜客對智聯招聘上的廣州地區關於產品職位數據進行爬蟲,抽取職位、月薪、地區、工作經驗、學歷、公司的數據。對於這個工具比較陌生,結合教程以及視頻,也能完成基礎的爬蟲。
計劃:1、在工作(加班)之餘,抽時間跟計劃完成每關課程。
2、學會用Excel進行簡單分析,例如對數據進行清洗、分析、展示等。
3、重拾SQL語言,曾經學習過資料庫編程語言,但是現在忘得差不多了,需要再多複習、多使用。
推薦閱讀:
※中國糖尿病及併發症發病風險數據分析報告
※Patchouli的機器學習系列教程八:邏輯回歸——『器』
※數據分析系列——SQL 必知必會(三)
※使用EXCEL分析數據分析師的發展前景