標籤:

入行大數據?

我讀過一些關於大數據的書,感覺是一種比較新的解決實際問題的方法。想要入行但是以前又不是學這個的,有沒有哪些方面我能夠做到來挽回的,例如,上哪些課什麼的?


題主得先介紹你個人的情況,或者說你的知識結構是什麼,這樣才好給你建議。

如果你是程序猿,那麼會有針對程序猿的建議;

如果你是運營人員,會有針對運營的介紹;

如果是產品經理,會有針對產品經理的介紹,

我看到知乎里關於大數據方面學習建議基本是關於技術層面的,而事實上這個領域要學習的東西實在太多了,我反倒認為應用層面應該是放在首位的,先定了方向,才知道應該怎麼尋找方法去落地。


學習統計學、社會學的研究方法和理論特別是定量研究方面、SPSS State SAS等統計軟體應用,可以學到方法,然後看應用到哪些領域,就多了解領域內背景知識幫助應用分析。相關入門數據比較好的有《大數據時代》《大數據》等


大數據分為幾個不同的板塊啦!主要是看你喜歡偏技術型的還是分析型的!

如果你對大數據感興趣,歡迎關注我們的信微:idacker 剛做不久,歡迎指點。


目前市場上的「大數據書」基本不涉及太多理論,讓你會有 哇原來是這樣我要是會了世界就在我手中 的感覺,然後就會有現在這種疑問。

事實上,大數據就像小朋友們聊嘿咻,談的多做的少,等做起來發現和想像的太不一樣。

因為我是做技術的,這裡只談技術層面。

大背景是,對於數據挖掘,國內的公司大多在工程層面上,研究所和高校做理論的會較多,所以真到實際場景下不會有作者想的那麼高大上,有一大半的時間會花費在前期準備和業務分析上。

然而這並不代表你就可以不懂理論,因為這樣很可能你連自己為什麼這樣做都不知道,更不用說改進和調優。

由於數據挖掘是一個交叉學科,理論層面上主要包括數學(比高數要龐雜得多),計算機等(一些特別的比如說生物方面的當然要懂生物);應用層面上要分領域,大體思想相通但是具體方法會有區別,也就是說如果你以前沒做過社交網路,業務突然需要做這塊,你就需要很快的了解大概並工程實現。因此,數據挖掘工程師大多都需要保持很高的好奇心和旺盛的精力,因為需要不停的學習。

上面的是個人的理解,下面給些乾貨,只說最最最基礎的配置:

數學:微積分,高等代數,概率論與數理統計,離散數學,隨機過程,數值計算

計算機:數據結構,資料庫,python,R,數據可視化

機器學習和數據挖掘:統計學習方法,數據挖掘概念與技術

同時,你需要大量寫代碼,在實踐中學習

這些最基礎的搞定後以後該怎麼深化你自己心中也應該有主意了。


tableau或者大數據魔鏡(http://www.moojnn.com)是一款大數據可視化工具,最大的特點就是免費,大數據和可視化,他的可視化效果自然是不用多說的,你自己也說了,是不錯的,據我所知,現在大數據魔鏡目前的可視化效果有近200種,並且還在增加中。


分享一片介紹大數據的美文:「大數據」時代的到來

所謂大數據是指那些大小已經超出了傳統意義上的尺度,一般的軟體工具難以捕捉、存儲、管理和分析的數據。


大數據應用很重要,拍腦門定決策、領導說了算的時代要過去了......


既然是叫大數據,而不是叫數據,那最基本的一個特點就是數據量特別大。用傳統的統計軟體 SPSS SAS 等已經不能滿足需求了。做大數據分析,需要掌握一些軟體。 以hadoop架構為基礎, yarn MapReduce HDFS等技術為核心, mahout spark作為主要工具。 是在Java語言基礎上編寫的。 總體來說,比較難


推薦閱讀:

大數據是不是侵犯隱私?
Ray的數據新聞學習日記(一):什麼是數據新聞
大數據在水利土木等工程學科中有什麼應用前景?
如何合理搭建大數據分析團隊?需要有哪些背景的人?
大數據時代,互聯網金融風控如何利用大數據建模而有別於傳統建模方式?

TAG:大數據時代 |