入行大數據?
01-30
我讀過一些關於大數據的書,感覺是一種比較新的解決實際問題的方法。想要入行但是以前又不是學這個的,有沒有哪些方面我能夠做到來挽回的,例如,上哪些課什麼的?
題主得先介紹你個人的情況,或者說你的知識結構是什麼,這樣才好給你建議。如果你是程序猿,那麼會有針對程序猿的建議;
如果你是運營人員,會有針對運營的介紹;
如果是產品經理,會有針對產品經理的介紹,我看到知乎里關於大數據方面學習建議基本是關於技術層面的,而事實上這個領域要學習的東西實在太多了,我反倒認為應用層面應該是放在首位的,先定了方向,才知道應該怎麼尋找方法去落地。學習統計學、社會學的研究方法和理論特別是定量研究方面、SPSS State SAS等統計軟體應用,可以學到方法,然後看應用到哪些領域,就多了解領域內背景知識幫助應用分析。相關入門數據比較好的有《大數據時代》《大數據》等
大數據分為幾個不同的板塊啦!主要是看你喜歡偏技術型的還是分析型的!如果你對大數據感興趣,歡迎關注我們的信微:idacker 剛做不久,歡迎指點。
目前市場上的「大數據書」基本不涉及太多理論,讓你會有 哇原來是這樣我要是會了世界就在我手中 的感覺,然後就會有現在這種疑問。
事實上,大數據就像小朋友們聊嘿咻,談的多做的少,等做起來發現和想像的太不一樣。因為我是做技術的,這裡只談技術層面。大背景是,對於數據挖掘,國內的公司大多在工程層面上,研究所和高校做理論的會較多,所以真到實際場景下不會有作者想的那麼高大上,有一大半的時間會花費在前期準備和業務分析上。
然而這並不代表你就可以不懂理論,因為這樣很可能你連自己為什麼這樣做都不知道,更不用說改進和調優。由於數據挖掘是一個交叉學科,理論層面上主要包括數學(比高數要龐雜得多),計算機等(一些特別的比如說生物方面的當然要懂生物);應用層面上要分領域,大體思想相通但是具體方法會有區別,也就是說如果你以前沒做過社交網路,業務突然需要做這塊,你就需要很快的了解大概並工程實現。因此,數據挖掘工程師大多都需要保持很高的好奇心和旺盛的精力,因為需要不停的學習。上面的是個人的理解,下面給些乾貨,只說最最最基礎的配置:數學:微積分,高等代數,概率論與數理統計,離散數學,隨機過程,數值計算計算機:數據結構,資料庫,python,R,數據可視化
機器學習和數據挖掘:統計學習方法,數據挖掘概念與技術同時,你需要大量寫代碼,在實踐中學習這些最基礎的搞定後以後該怎麼深化你自己心中也應該有主意了。tableau或者大數據魔鏡(http://www.moojnn.com)是一款大數據可視化工具,最大的特點就是免費,大數據和可視化,他的可視化效果自然是不用多說的,你自己也說了,是不錯的,據我所知,現在大數據魔鏡目前的可視化效果有近200種,並且還在增加中。
分享一片介紹大數據的美文:「大數據」時代的到來所謂大數據是指那些大小已經超出了傳統意義上的尺度,一般的軟體工具難以捕捉、存儲、管理和分析的數據。
大數據應用很重要,拍腦門定決策、領導說了算的時代要過去了......
既然是叫大數據,而不是叫數據,那最基本的一個特點就是數據量特別大。用傳統的統計軟體 SPSS SAS 等已經不能滿足需求了。做大數據分析,需要掌握一些軟體。 以hadoop架構為基礎, yarn MapReduce HDFS等技術為核心, mahout spark作為主要工具。 是在Java語言基礎上編寫的。 總體來說,比較難
推薦閱讀:
※大數據是不是侵犯隱私?
※Ray的數據新聞學習日記(一):什麼是數據新聞
※大數據在水利土木等工程學科中有什麼應用前景?
※如何合理搭建大數據分析團隊?需要有哪些背景的人?
※大數據時代,互聯網金融風控如何利用大數據建模而有別於傳統建模方式?
TAG:大數據時代 |