標籤:

數據分析師入門

這幾天正好是跨年,18年好像一瞬間各大APP都開啟了數據分析新玩法:私人訂製年終總結。

網易幫你總結聽歌,支付寶幫你總結賬單,還順便玩兒了下18年預測詞。

不得不說這一套大數據組合拳打下來真的是效果超群。

在這個拔涼的冬天,讓我們大家心底里泛出了一絲暖意。

俗話說:內行看門道,外行看熱鬧。

這一年你共聽了多少首歌,你睡得最晚的那天在聽什麼歌。

你一年支出了多少錢,最愛買的品類是什麼。

他們是怎麼統計的?又是用什麼方法得出的結論?最重要的是他們是怎麼想到的?

  • 先說我能解釋的:他們怎麼想到的?

引用梁東與吳伯凡的話就是:大數據時代,重要的不是數據本身,而是人們與數據產生聯繫的行為所產生的數據。讀起來很拗口吧,我舉個例子:

比如一個包子,在互聯網中它只是個物體,只是一個數據點,有人去購買它,分享它,購買和分享這個行為產生的數據具有重大的意義。

甚至什麼時間購買,購買幾個,什麼餡的。都會經過挖掘與分析產生重要又不可代替的觀點。

這個觀點又可以指導許多行為,在什麼地方開店客流量大,讓哪幾個網紅分享會帶來流量等等。

這就是數據分析的意義,小到準時在公司門口為你遞上最愛的早餐,大到預警將要爆發的傳染病毒。只要對你所掌握的數據科學分析,都能做到。

說的實際點,在工作中,能夠用詳實的數據支持自己的論點;用數據預測項目的發展,更高級的可以自己寫程序來實時監控自己關注的網站,等等。

  • 接下來說下我知道方向但是沒法解釋原理的:他們是怎麼統計的?和用什麼方法得出的結論?

我認為應該是支付寶,天貓,淘寶三大數據源,採集用戶全年消費金額,消費品類,線下支付金額及信用還款情況。

網易雲則應該是收藏的歌單,聽歌時長,評論條數,聽歌時間段的綜合數據。

用什麼方法?當然是大數據分析,工具嘛是Python,還是R我不知道,這裡暫時留一個坑,上手技術再來填。


接下來是數據分析師的術:

各行業的新手教程都有極強的指導意義,無論是否是數據行業,數據分析技能都會賦予你更理性客觀的思考方法。

Python入門已經寫好啦,歡迎大家來看。

暢姐姐:一篇文章入門Pythonzhuanlan.zhihu.com圖標

其實這個入門入得我好痛苦,我的電腦是surface,用戶名是中文,所以安裝python一直是不對,然後我又在網上找了好多辦法改用戶名,結果因為是家庭版win10所以用戶名不允許更改,接著我用了最後一招,給客服打電話,還是改不了,然後。。。。我就給自己重新安裝了一下系統啊哈哈,我真是好棒!所以好事多磨,經歷了這麼多之後在敲代碼的時候報個錯我完全不緊張。大不了從來一下唄!

我的工作深刻的告訴我一個真理:任何事情想要做之前一定要在小範圍內進行測試。

所以先列出大致的學習時間與內容,用一星期時間進行調試。

以上數字代表小時。

每天2小時即120分鐘:15分鐘預習,15分鐘複習,90分鐘學習。

周六周日5小時300分鐘:60分鐘複習一周的,240分鐘學習。

學習之前開啟番茄鍾,要記錄自己每天的輸出成果,即時更新知乎,包括自己的計劃,實施情況,遇到的問題,怎麼解決的,一句話總結經驗。

最後,我想說說數據分析對我來說意味著什麼。今年8月份畢業到現在工作快半年的時間,在這期間我對於數據這塊學了函數,學了一點VBA,能做到幾萬級的數據整理提取,但是隨著EXCEL打開越來越慢,我開始著手優化,想把公司的資料庫改成MySQL,學習了一陣之後感覺不僅效率低還沒有方向。所以在年末的時候加入猴子的社區和小夥伴們一起互相監督學習。

  • 如果每個人都是一個坐標系的話,那麼數據分析就是我的原點。它能教我怎麼看待這個世界

目前我有個小目標,寫一篇知乎上數據分析的文章,從爬取數據到清洗數據,再到建模和分析,得出結論。


推薦閱讀:

用Python預測「周期性時間序列」的正確姿勢
一篇文章入門Python
Kaggle機器學習之泰坦尼克號生還預測
大數據人的職業生涯規劃分享要點

TAG:數據分析 |