文科生能做好數據分析師嗎?如何提高相關技能?

背景:

傳媒類專業畢業,一直做視頻剪輯、編輯方面的工作。沒什麼編碼基礎,只在大學時期考過VB。偶然得到一份數據分析師的工作,便決心從零做起。

疑惑:

工作近一年,一直在做數據整理方面工作,感覺沒什麼分析提煉的能力提升。自學了一點SQL查詢語句,統計學與概率教程看不懂理論與具體工作有什麼關係。想問我這種情況該從哪方面著手自我修鍊呢?


完全有可能。

題主知不知道有個專業叫心理學,這是一個理科專業,但是是文理兼招的。心理學專業要學很多數據分析,很多文科生也學的很好。

首先破除一個誤解,數據分析師最主要的能力不是計算機技術,而是數據統計分析能力。其實小公司裡面的數據分析師能力要求並不高,周圍的數據分析師很少有高級到懂機器學習的。大家說的懂Java什麼的我覺得是數據挖掘工程師了。數據分析和數據挖掘需要掌握的技能有什麼區別? - 紀路的回答須知數據分析師到數據挖掘工程師之間還差了100個程序員。下面貼出阿里的「數據分析師職位技能樹分析,進阿里什麼難度大家懂,所以應聘小公司「數據分析師崗位的話技能要求可適當放低。」」校園招聘時一位應聘「數據分析師」職位的學生應該具備哪些技能? - 知乎用戶的回答

如果你要入坑數據分析師,我建議你從四方面入門: (根據阿里數據分析師試卷)

1.統計學

2.SQL

3.spss

4.R語言

統計學絕對是數據分析師的核心競爭力,是你技能樹的骨幹,你要知道過去數據分析也是直接靠人工計算的。但是現在數據量級越來越大,靠手算已經不能解決問題了。所以我們需要一些工具來幫助我們處理數據。比如spss就是一個專門為數據分析開發出來的成品軟體,已經非常成熟了。你可能聽別人說數據分析師要會spss和SAS,其實呢,他們就相當於PPT和Keynote的關係。工具嘛,會一門就行。對於你這種還沒入門的,spss比SAS簡單,你可以就學spss不學SAS。那SQL是幹什麼的呢,它是資料庫語言,也就是說數據太多了你要建個倉庫把它們分門別類的放好,方便查找。R語言呢,是專門用來統計和製圖的一門編程語言,也是數據分析的利器。但是呢,其實spss已經有很多功能了,所以R語言並非必要,只能說是個加分項。

所以只要你統計學的好,spss和SQL也會了,基本上就差不多了。

至於學習難度呢,統計學選外國的教程看起來思路就明晰很多。SQL選對了書一點也不難,spss比SAS簡單好多,就是一個直接點的軟體,R語言跟你想的不一樣,它也跟一般的編程語言不同。不需要多少編程基礎,非常適合作為文科生的你。

話不多說,直接推薦入門書籍:

1.統計學:國外的統計學書籍你自己找找,看書做練習題。

2.SQL:《head first SQL》強推,超級簡單

3.spss……這個都可以,在網上找找課件

4.R語言:可以從code school上R的入門教程學起,書的話《實戰R語言》《R for beginners》《R語言核心技術手冊》 入門之後再多分析case,多運用。

還有這個答案,很值得參考如何快速成為數據分析師? - 卡牌大師的回答

但是入門之後,往深里學的話還是要彌補一下自己的數學方面的短板,高數、現代、離散數學(計算機數學)和數據結構(計算機數學)等。尤其離散數字。前期你也許感受不到這個的重要性。可是後期你會越來越感受到。比如你學R語言的xx包,那個包有個論文,然後你看論文發現裡面講了有向圖,你就會想這個有向圖是個什麼鬼。然後你學了離散數學就知道了。數據分析師總之是一個數學和計算機交匯處的職業,所以計算機方面比如網頁分析等等也需要涉及一些。這些也並沒有你想像的難。我們科班出身的也就是一門學了一學期而已。

然後關於如何入門數據分析師和數據分析師的要求,推薦你翻一翻知乎上關於數據分析師的答案。多看看,然後制定自己的學習計劃。Michael282694大神的專欄文章「上篇」同學,你的offer掉了——互聯網求職志 - 有Michael282694的地方就有江湖 - 知乎專欄裡面介紹了很多關於數據分析、挖掘和R語言的公眾號和資源。還有一些博客、統計之都等等可以去看看。R語言有什麼問題可以在Stack Overflow上提問和找答案。

最後,要對自己有信心,有一個idea就去實現它。這是完全可能的。多看書,多刷題,刷到一定數量開始嘗試解決實際問題。我有個文科同學就做了一個學期習題期末統計得了我們班最高分 99。現在統計很厲害。

但是我覺得你更應該考慮的是你的職業規劃你學數據分析到底是準備現在就靠這個找工作呢還是把它當做未來的跳板?如果在小公司,數據分析師技能要求並不高,你也許學個幾個月就可以去了。可是與之對應,工資也並不高。你不一定願意。如果去大公司呢,技能要求高,那需要一定的時間。

總之,相信自己,文理科本來就是一個人為的劃分而已,大家的腦結構並無顯著差異。加油(^_^)


一個中文畢業做了5年文案然後因為在一家提供數據分析服務的公司里而不得不天天泡在數據里的人忍不住來回答這個問題。

說到數據分析,可能很多人第一時間想到的是要懂統計學,要會各種演算法、公式,需要會Excel、SPSS、Python、R、SQL……一系列軟體,於是很多文科生,尤其純文科背景(比如中文畢業的我……)望而卻步,想都沒想過會做數據分析,但是,有一件事大家也必須正視:在這樣一個大數據席捲各行各業的年代,會有越來越多的人被捲入「數據分析」大軍里,舉個簡單的例子,互聯網運營這個職位,無論是活動運營、內容運營,抑或是用戶運營,都不得不開始去學、去用數據分析,因為這是一個「數據驅動」的時代

接觸了數據分析之後,才發現,技能門檻沒我想像的那麼高,門檻真正高的是:對商業思維、業務邏輯的掌握

在現在的技術手段下,Excel玩不好,沒關係,有Tableau(Tableau Software)、Domo(Data Management – Data Analytics – Data Reporting | Domo)、數據觀(http://shujuguan.cn)之類的軟體幫著實現在Excel里需要寫函數甚至編程才能實現的數據處理;不會寫Python爬蟲,沒關係,用八爪魚(八爪魚採集器 - 最好用的網頁數據採集器)一樣能爬很多數據;統計學底子薄,沒關係,直接上公司的全量數據,繞開抽樣、概率問題……基本上,對於一家公司來說(BAT這樣的龐然大物就算了),高中數學程度+懂公司業務,就能完成80%以上公司的數據分析需求。

因此,身為一個文科生,在進入數據分析領域的前期,首先要做的重中之重是想盡一切辦法,去理解公司業務,去學習與公司業務相關的商業知識,比如一家做電商的企業,你就需要去理解其採購、銷售、物流、推廣、客服等流程、內容、控制要點等等。只有理解了業務,你的數據分析才能有的放矢,才能迅速獲取反饋,才能產生價值。其餘的統計學也好,公式也好,演算法也好,都是為了你的業務目的服務的。

在理解了業務之後,去全面收集公司里的數據,無論是系統里的,還是以表格形式存檔的文件,然後按照業務類型,逐一查看都涉及哪些數據,這樣,結合你對業務的理解,你就能知道自己能做哪些分析,這些分析中的關鍵指標是是什麼,以及你想做哪些分析但是還缺哪些數據支持。

第一步是為了建立分析思維和思路,第二步是了解手中的素材。然後,去做就好了,在做的過程中,一定會暴露你缺的技能或知識,比如,數據不知道怎麼導出了,數據處理處問題了,公式不會寫了等等。技能或知識比較簡單的,買書、上網或者找老師,抓緊學;技能或知識太複雜的,學習時間成本較高的,先去尋找有沒軟體或服務能幫忙解決,然後再慢慢的補起來

一定一定要記得,做數據分析是為了幫公司「降本增效」,而不是為了炫技!因此,能解決業務問題,能優化業務流程,能為決策及時提供客觀、真實的依據的數據分析師,就是好分析師。

當然要成為分析大神,那絕對是需要很多高深的理科知識,需要掌握很多複雜的工具的,這個就路漫漫兮上下而求索吧。


謝二師兄邀,看到有些盆友從知識儲備方面入手回答了題主的問題,說得都非常棒。不過在我看來,這些對於題主而言是重要但不緊急的事情,可以作為你的日常研習目標,但短期內對於工作的提升幫助不太大。

我從重要而緊急的業務方面回答一下吧~

(再啰嗦一句,上述的知識儲備只是不緊急,但是非常重要,題主如果真心想轉數據分析,一定要花時間去學習)

你說工作近一年,一直在做數據整理方面的工作,感覺沒有鍛煉和提升;不知是在一家什麼樣的公司,不過你看看能否回答我的這幾個問題:

1、你了解你所整理的數據的來源嗎?是自己公司的業務數據,還是與合作夥伴交換的數據?是自己公司相關部門採集的,還是從第三方獲取的?獲取過程中,具體的指標和邏輯是什麼?

2、這些數據是真實的嗎?採集和整理過程中會不會出現什麼問題?技術上的邏輯和業務上的邏輯是不同的概念,有沒有技術上沒有瑕疵,但並不符合業務邏輯的數據流程?(這個問題可能要稍晚回答,但請你牢記於心)

3、到你手裡的數據經過了什麼處理?你又做了什麼處理?為什麼他們和你要做這些處理?

4、誰需要你的數據?你處理後的數據流向哪裡?他們用數據做什麼?這些數據最終又拿去做了什麼?比如,為客戶做了什麼服務,公司發布了什麼內容,或向管理層證明了什麼KPI,或支持了哪個部門的評估?

5、你做整理的周期是什麼?為什麼是這樣的周期?

6、公司有其他的部門在處理其他的數據嗎?是什麼樣的數據?和你有什麼關係?為什麼這些數據要分開處理?

7、近一年,你自己的電腦上應該已經積累了不少數據,試試做個分析,從一段較長的時間來看,你負責的這一塊數據發生了什麼變化?為什麼會有這個變化?和公司的產品、經營、業務有關,還是和行業有關?具體怎麼有關?

……

看到這裡,估計你能大概有個idea了。「數據分析」,對公司業務和行業的理解是非常非常重要的部分。如前面知友所說,很多數據分析師招來只是為了做個報表。你搞懂為什麼要做這個報表,就比大部分人強了很多。

然後,你可以嘗試在完成自己常規工作的同時,增加一些思考,比如:

數據指標的設定是合理的嗎?

數據的採集方法是合理的嗎?

是否有更好的方法、周期來做這個數據的整理?

你覺得還需要整理什麼其他數據,是你目前沒有涉及,但對你的下游有用的?這需要哪些部門的什麼支持?

你的數據如何和其他部門的數據進行整合?

你所得到的長時間的數據趨勢,與行業公開信息是否有相互印證,或者互相駁斥?這是什麼原因?

基於這些數據,有沒有業務優化的可能性?具體是?

或者有沒有可能做新產品?雖然公司可能不會有這樣的機會,但這個問題對於你很重要,也許你下一家公司需要這個啊~

看看其他家的數據分析師招聘,你能立刻理解這家公司招這個分析師需要什麼資質、入職後要做什麼嗎?

總之,我的意思是,你必須要理解你做數據分析的原因、過程、結果,這樣才能保證你的數據分析知識用到刀刃上,而這和文科理科沒有什麼關係,甚至文科生/商科生可能更有感覺哦。

加油,祝你成功~


做數據分析這行呢,最重要的是「好奇心」,也就是說是否喜歡去問問題,問對問題,琢磨問題。它是一種天賦,也可以後天練習,但這種東西,很少有人意識到需要訓練。這個東西也是所有分析師的職業瓶頸。最終你是大師還是工匠,全看這個瓶頸。其它的東西,數學也好,編程也好,都是可以補的,不是最重要的。

第一名向磬予答案有60多個贊,第二名任明遠只有20多個贊。可見搞數據的人大多喜歡看的見的技術工具,不喜歡真正困難的「問題」


文科生同樣有機會成為優秀的數據分析師。

根據我這些年來招聘、指導和管理過數據分析師的經驗,要做好數據分析工作,硬技能方面需要掌握資料庫查詢語言(SQL)和數據處理工具(Excel),具備一定的統計學知識,能夠用清晰的邏輯講清楚業務故事,軟技能方面最重要的是數據敏感性。

要掌握這些技能,對一個文科背景的同學而言,雖然面臨一定的挑戰,但卻不是毫無機會。不過,即便是對理科生而言,要想成為優秀的數據分析師,也必須在這幾個方面下一定的功夫,因而對文科生而言,固然是有機會,卻也還需要投入大量的學習和練習,不斷加強自己的知識儲備、技能積累,確保常用工具應用熟練,才能在數據分析工作上有更好的發展。

前面提到的這四大技能點裡,數據處理相對而言門檻是最低的。SQL學習只要找一本常見教材,認真學習語法邏輯,然後進行一定量的訓練,普通的本科畢業生花2-4周時間基本上都可以順利掌握常用的語法和查詢命令。至於Excel,在不考慮VBA的前提下,可能是學習曲線最平坦、同時也是功能最強大的數據分析工具。互聯網上有大量教程介紹Excel的常用公式和命令,只要能夠大致了解其用途,很多細節內容都可以在實際需要使用時再通過搜索引擎補課。對絕大部分有志於在數據分析方向有所發展的同學而言,數據查詢和處理的基礎技能都不會構成難以逾越的門檻。

統計學知識方面,看起來艱深複雜,但其實絕大部分高深的理論推斷在數據分析的日常工作中都很少使用,而實際使用較多的往往是那些最基礎的統計學概念,包括各種基礎統計量(均值、方差、中位數、分布、假設檢驗等)和各種基礎的統計分布(離散變數的二項分布、泊松分布,連續變數的均勻分布、正態分布等),並且實際應用中往往是對統計學思想的領悟比具體的統計學概念的應用更加重要。因此,即便是文科生,學習並掌握一些重要的統計學思想,也是完全有機會學好用好的。

用清晰的邏輯講清楚業務故事,這個概念其實包含了兩層意思:

一是要講清楚的是業務故事。這對一些更擅長符號邏輯和抽象推演的理科生而言,往往面臨著不小的挑戰。實際在講故事時,為了降低受眾的理解成本,邏輯必須和實際的例子相結合,例如講到某個項目的年化凈收益率很高,超過100%時,更通俗的解讀是說投入100元,不到一年時間就可以收回全部成本,並且收益超過100元,其核心要點是要能夠從抽象的概念對應到實際的故事。

二是必須帶著邏輯講故事。通過什麼樣的因,得到什麼樣的果,中間有哪些相關的影響因素,各種因素通過什麼樣的邏輯通道對結果產生影響,影響的程度有多深,這些都得講清楚。

這兩個層面的要求,對文科生而言,都沒有什麼特殊的劣勢,甚至在某種程度上是文科背景的同學比理科背景的同學更有優勢的地方。

最後一個重要的要點是數據敏感性。數據敏感性乍看起來是玄學層面的概念,但其實和我們的日常生活聯繫也很緊密。我有一位前同事,在數據敏感性方面超乎常人,他的秘訣是抓住一切機會鍛煉自己的數據感覺,最典型的場景是,每當開車在路上遇到堵車時,拿前車車牌上的數字組合計算24點。另外還有一位朋友,每次購物的時候,遇到不同包裝規格的商品折扣時,都會通過心算評估各種折扣組合的優惠程度有何不同。這些例子背後,包含的其實是一個聯動的閉環:一方面,因為他們對數據有濃厚的興趣,所以在每一個有機會分析和計算數字的場合,他們都會有意無意的展開數據計算和鍛煉,這一過程的不斷重複,有效的強化了他們對數據的感覺;另一方面,他們通過對這些數據的計算,從中找到了樂趣和價值,形成了關注和思考數據的正反饋,在後續更多更豐富的場景中養成了用數據來思考問題的習慣。這些過程其實也和他們是文科背景還是理科背景沒有多大關係,基本上還是依靠自己的興趣而非專業課程的學習來驅動。

以上這幾個方面的分析充分說明,文科生完全有機會做好數據分析。當然,話說回來,這裡面每一個方面的提升,都需要大量的學習和訓練,也都不是隨隨便便就可以取得巨大成就的。

因此,我的結論是,文科生和理科生一樣有機會做好數據分析,學科背景標籤對是否能做好數據分析而言並不是一個重要的特徵。但是,做好數據分析一定是需要通過針對性的去學習和提升,補強自己的短板,讓自己的強項變得更強的過程。在這個過程中,建議更多的關注自己投入了多少時間和精力,學到了多少知識,掌握了多少技能,而不用過於糾結自己的文科生專業背景到底會對未來的發展產生多大的局限。

題主加油!


謝邀。

簡單只看標題的話,文科生決心做數據分析師是不是瘋了,謹以為:「不是」。

但是要分情況討論。

如果題主說的文科生,指的是高中文理分科的時候,理科完全學不下去,所以不得不學文科,因為感覺文科好像多少都能答點分,或者死記硬背總能蒙個幾題。

這種情況下的文科生,我強烈不建議從事數據分析。

雖然說數據分析並不需要特別高深的數理統計知識,尤其是在互聯網行業,很多公司可能只需要統計 101 的前幾章就夠了(當然需要別的方面突出),然後如果高中數學的一些概念都搞不清楚的話,比如說丟骰子算概率這種,那麼數據分析這份工作要麼做起來非常痛苦,要麼發展會很受限制。

如果題主說的文科生,指的是高中不小心選了文科,或者大學學了偏文科的專業,比如生物(捂臉.jpg),那還是有希望的。

就我有限的工作經驗來看,做好一份基礎的數據分析工作,簡單說需要以下幾個方面,數理統計知識是基礎,保證做出來的分析結果是可靠的;coding 技術要過關,否則只能是空想;對產品有了解,知道做哪些方面,如何做,結果說明什麼問題。

所以如果你是一個文科生,但是高中數學還不錯,對概率這些東西不抵觸,也會用 Excel 簡單處理數據,平時碰到問題也有一點數據的概念,那麼決心學習一下如何做數據分析師是完全沒有問題的。

具體的方法可以參考這篇:鄒昕:如何快速成為數據分析師?

在基本的技術方面的東西過關之後,多花時間精力在如何摸清產品、業務是怎麼運作的,所在行業的情況,公司里各個部門的合作、溝通等等。

很多時候提出一個好的問題,是解決問題的關鍵。

所以,對於文科生做數據分析師,我覺得是完全可行的(比如說我)。

但是,在大多數情況下,我們不能指望著一夜之間,就能做得比那些「科班出身」的人做得更好;而是要把自己不擅長的方面補齊,不至於成為我們的瓶頸,同時發展我們的優勢。

而且更重要的是,不要跟別人比,更多的應該想想:我們是不是喜歡現在做的東西?相比做別的東西我是否更開心?我們做的東西有沒有意義?我們做的東西對這個世界/人是否會產生積極的影響?當然,也要考慮是不是能給我們帶來經濟上的報酬。

簡單來說,不能指望一步登天,但是是完全可行的。

比如我現在老闆的老闆的老闆就是個通常意義上的文科生,大學專業是學文學的。


轉一個文科同學的轉做數據分析的成功的例子 @王濛濛 現在在Zillow http://www.zillow.com/ 做數據分析


首先數據分析師是有兩個不同的側重方向的:

1 側重業務的業務數據分析師,這類其實對於Code以及工程相關的技能要求並不高,這意味著你不需要做很複雜的代碼問題,但是一定是對業務理解的足夠透徹,並且擁有敏銳的數據思維,能夠快速分析出數據的潛藏的變化,從而來指導業務,側重於業務的分析,這類的工作經常是諸如出具業務分析報告啊、業務分析啊,給決策層出具數據分析結論幫助決策啊,這類人除了善於分析數據之外,還得善於歸納總結,以及表達。

2 偏向於底層的數據分析師,這類分析師基本與數據預處理,數據轉換,數據加工等關聯很緊密,需要有一定的諸如數據查詢、數據預處理,腳本加工等code能力,對資料庫,以及諸如大數據框架中的hive等等能應用熟練,但是,只要是數據分析師,那麼一定會與業務掛鉤,只是說與上面還是有側重點不同,這類分析師應該是能夠算為工程師的,是與其他底層工程師打交道的,然後構建數據倉庫啊,做數據報表啊,做數據的BI系統啊等等,偏重於工程。

入題主,或者有類似跨界的朋友,其實如果沒有理科功底的話,但是對於數據業務有足夠的敏感度的話,其實是可以考慮的。

不止如此,據我所知,今年,好多其他行業的轉入大數據行業,當然也包括了針對性的方向是數據分析的。


首先看你的工作職責是什麼?

企業想看到的數據分析結果是什麼?

這兩個決定我們首先需要掌握哪些技能。

如果是純粹的數據挖掘或數據建模,那就學習SQL,統計學,R語言等等,這些方面的書知乎上的推薦很多。

如果是傾向企業業務的數據分析,一般Excel已經夠用了。

如果你看不出統計學概率論和工作有多大關係,初步判斷應該是業務型數據分析,

這樣的話文科、理科、工科其實沒多大關係,只要你對數據分析確實有興趣;

像我就是做表做到很開心,一寫PPT就心情很愉悅,自己都完全受不了了.......

所以你不要受限於文科這個思維,想想還需要學習掌握哪些技能,看準方向走下去就好了;

這是我幾年來數據分析的一點兒經驗,希望可以幫到你。

一、數據分析的需求

數據分析的首要工作是了解需求,這樣後期分析的路才不會走偏;

當我們知道企業想要看到的結果時,就可以反推過程及起因,把相關因素的數據列出來;

同時也要了解業務、或者產品,這樣最終的分析結果才能接地氣兒;

二、數據處理的方式

養成隨時收集數據的習慣,就算現在覺得沒用的數據也不要刪,說不定哪天就要用(血淚教訓);

日常報表做一個固定模板,熟練掌握Excel函數,sumifs,countifs用處不要太大哦,固定模板的好處是大大減少數據更新的時間;

在去年的時候我接手了一項工作,每月匯總更新數據就要兩天,是可忍孰不可忍;於是花了三天時間做了一個動態圖表模板,然後每月只要花20分鐘就完成數據更新;

所以除了函數,還有掌握數據透視表,動態圖表,這樣處理一般企業的數據分析已經足夠用了;

三、分析結果的呈現

很多人在說數據分析的時候會略掉這部分,但這恰恰是最展現我們工作成果的環節;

呈現首要重邏輯,彙報要做到條理清晰,所以怎麼寫好PPT也是我們的必備技能哦;

寫PPT第一步先寫好目錄,搭建好報告的架構,每個部分要寫多少頁,每頁小標題是什麼,調整好思路後學的內容填充就快多了;

二是選擇合適的圖表呈現,不做無意義的圖表呈現,圖表要做適當調整,讓人一目了然;比如下面這兩個圖,你會更願意看到哪個呢?

三是語言精練,不要用口頭語,純文字超過三行就要考慮觀者感受了,相信你在這方面應該是沒問題的。

唔,來知乎的第一個答案,多謝看到這裡的各位。


立帖,占坑。我是學中文的,高考數學沒及格,大學沒有任何數學課。以前是悲觀的理想主義者,裝逼偽文藝青年。現在在互聯網公司做運營,數據方向。以前不喜歡數學和計算機,工作之後突然覺得彼此特別有意思。我喜歡語言,溝通理解世界的一種方式。機器語言,數學語言如果錯過太可惜。從Excel的函數和VBA重新學習,能處理大部分基礎數據,彙報表格,演示。大學學過簡單的SPSS,可以做簡單線性分析,多元線性和邏輯回歸等還要學。現在在學MySQL,用以select聯合查詢等,熟練使用SQL語句和資料庫基礎應用知識。再學編譯語言,R,Python或php。MySQL做嵌套,寫個循環填充代碼太麻煩,在thinkphp框架里就簡單。專註,熱愛,自律,未來我也會成為一名優秀紮實的數據分析工作人員。以上都是工具應用,核心是業務邏輯和關鍵的統計學等基礎框架知識。目前我做的也只是數據統計,有幸經歷從0到1,運營指標體系,埋點數據等的搭建,和BI,DB等業務連接。現在通過埋點統計等了解產品整體運營情況。基於用戶行為的定性與定量分析,調整運營策略,驅動產品決策。

人會長大三次。第一次是在發現自己不是世界中心的時候。第二次是在發現即使再怎麼努力,終究還是有些事令人無能為力的時候。第三次是在,明知道有些事可能會無能為力,但還是會儘力爭取的時候。

主要是被美女領導說,你咋這都不知道或我不知道你能做什麼。。聽不懂程序員交流,多尷尬丟人。好好學習。

共勉


一、對於文科生能不能成為一個好的數據分析師,我的答案是一定能

因為從高考數學不及格,到後來本科英語專業,除了花錢,沒跟數字打過交道,大四開始自學高數、線代、統計學概率論,研究生跨考到經濟學專業(別笑,經濟學也是要計量分析的【捂臉】),到現在是一家在全球提供專業數據分析服務公司里還湊合的數據分析師的我,現在基本上已經不認為什麼事情是不能的了。

但是!

我對於問題中的文科生的理解是,數理基礎弱,技術底子薄,沒怎麼接觸過數據分析處理方面問題,但對數據分析感興趣,不會妄自菲薄覺得自己不是這塊料,準備義無反顧入數據分析坑的童鞋。

以下言論也只針對這部分童鞋。如果你打心眼兒里就不喜歡數學,見著圖表、數字就頭暈犯困,也不知道自己為啥要入行數據分析的話,我是覺得世界那麼大,坑那麼多,不必糾結這一個。。。

二、至於文科生如何成為一個好的數據分析師,我回答分成下面幾個部分:

(1)問題認識:

· 數據

vs 分析

· 技能

vs 業務

(2)自我認識: 好的數據分析師不止一種,你想成為哪一種?

(3)技能升級:如何成為一名好的數據分析師

· 冷兵器Hard

skills

· 熱兵器Soft

skills

一些拙見,僅供參考。

-------------------------------------第二個問題答案本案------------------------------------------

(1)問題認識

· 數據

vs 分析

數據分析大概是當今除了微信朋友個數之外,大家誤解最深的詞。

數據不等於數字!數據是事實或觀察的結果,是對客觀事物的邏輯歸納。並不是大量的阿拉伯數字堆在一起就叫數據,你單純整理一些不懂背後含義的數據和你整理你家衣櫃里的衣服並沒有什麼區別

舉個栗子,給你某個地區所有人一個月內手機拍的所有圖片,這個算不算數據?能不能分析?當然可以! 現在對於數據的定義已經相當廣泛,關鍵在於你是怎樣認識和理解你擁有的數據,如何從裡面挖掘信息,如何將這些信息與現實問題聯繫。

所以害怕接觸數學或者數字的文科童鞋們不必害怕,再多的數據經過提煉都是一些信息而已,本質上並不比分析八卦消息來得困難。

分析不等於整理! 數據分析師歸根到底是分析師,要求的是邏輯思維能力、分析歸納能力,整理工作只要是強迫症就能做得來。從事分析工作最關鍵的是目的,不管你分析的是什麼數據,一定要有一個明確的目標,將自己的工作放在整個企業閉環中,弄清楚自己的什麼分析為誰提供了什麼價值,這樣才不會迷失在爆炸的信息里。再複雜的分析也不過是用信息到目的過程,只要頭腦清醒,分析工作並沒有想像中的困難

· 技能

vs 業務

「我沒有學過統計」 , 「我沒有編程基礎」 , 「我Excel都用不好」

…….

困住大多數文科童鞋進軍數據分析步伐就是專業技能,但也沒有那麼高大上,不過是高手們較量用的武器罷了。有些武器簡單粗暴,有些武器酷炫拽,但區別其實也就是修鍊的時間長短不同。所有的技能也是一樣,掌握與否只跟你花費的時間有關係。

比武器更重要的是,你要明白你的武器在哪裡用,怎麼用才能達到最大殺傷力,這就是業務。業務更像是方向,讓你更加透徹的理解自己技能使用的邏輯在哪。

場景是什麼?需求是什麼?我能用什麼解決一個什麼問題?怎樣為企業/自己帶來價值?效果怎樣?怎樣監控?如何優化或替代?當你站在更高的角度看你所使用的技能時,你的思路會更加清晰。

對以上四點的理解深度和掌握程度決定了一個數據分析師的水平,缺一不可。

(畫外音):emmmm….可是。。。為什麼講什麼多跟問題無關的廢話?

因為我希望所謂的文科生,不要為自己設限,覺得數據分析是一件挑人的事情,其實她所需要和具備的東西,大多數與你擔心的無關,如果她是你的興趣所在,儘管去嘗試吧~

(2)自我認識:好的數據分析師不止一種,你想成為哪一種?

· A型:

「我有故事,你有數據嗎」

A型是業務端數據分析師,包括但不僅限於數據運營,商業分析,產品經理等。

此時分析思維能力,商業敏感度,業務理解是A型分析師賴以生存的技能,分析工具掌握,高階數據挖掘技能則是錦上添花。

· B型:

「碼code讓我快樂,寫演算法使我滿足」

B型是技術端數據分析師,也稱數據挖掘師,分析師需要將業務需求抽象成一個具體的數據假設或者模型來指導實踐。

此時數理知識,統計學基礎,編程技能是核心競爭力,但是業務和分析能力要求沒有A型高,但也是必不可缺,因為對業務的理解很大程度會影響特徵的選取和模型的質量。

· A型

vs B型

A型對技術要求不高,但需要對行業,商業邏輯,業務分析深入了解。需要多擴充知識儲備,掌握行業最新動態。適合思維活躍,善於接受新鮮事物,對技術無感的童鞋。

B型因為技術難度大,對基礎理論要求高,薪資一般也高於A型,比較適合喜歡安安靜靜碼code,探索技術背後的美妙世界的童鞋。

對於文科生來說,兩者都是很好的選擇,關鍵看你對自己的認識是怎樣的,以及你的興趣在哪,文科生也可以愛上碼code,比如說我。。。哈哈哈

(3)技能升級:如何成為一名好的數據分析師(終於講到重點。。但個人資歷有限,純屬個人經驗之談)

· 冷兵器Hard

skills (B型數據分析師必備)

a. 基礎知識系:數理知識,統計學,概率論,模型理論。。。

對於文科生來說這大概是最頭疼的一塊兒,很多人即使看完了一本統計學,也沒啥感覺,似懂非懂,沒法兒跟具體工作聯繫起來。網路上學習資料、書籍、視頻、教程鋪天蓋地,可是看不懂+不理解+聯繫不上生活,讓很多人感到迷茫,但又沒法兒放棄,him

尷尬。。。

原因還是在於枯燥的知識讓人提不起興趣,以及沒有真正的理解這些知識

Step

1:讀史(哈哈哈…

him文科生)

推薦《數學之旅系列叢書》[美]約翰·塔巴克 著 一共五本,並不是教科書,更像是科普冊,「從中你可以學到一些如何觀察現象和提出問題的方法,了解教科書中那些定理的形成,從而把自己投入到人類文明的進程中去,或許可以成為閱讀者意想不到的收穫。」

《數:計算機、哲學家對數的含義的探索》《數學和自然法則:科學語言的發展史》

《幾何學:空間和形式的語言》 《概率論和統計學:不明確的科學》

此外還有人給我推薦:BBC系列視頻《BBC-數學的故事》、《BBC-Code》、《BBC-統計的樂趣》、《BBC-數據的時代》,都是良心之作。

Step

2:有了一些背景知識和興趣之後,可以讀一些初級入門的國外的教材(更側重思維導向的訓練,容易理解)

專業教材網路上很多推薦,我就不贅述了。

這裡強推一下Head

first(深入淺出) 系列。因為之前學爬蟲的時候看過 《Head

first HTML》,感覺很好上手,後來陸續看了 Head first python,Head

first Statistics…依然體驗很棒。非常適合底子薄的同學作為入門寶典。

Step

3: 同時,還可以去一些學習網站看一些課程:

推薦 可汗學院公開課:概率

麻省理工公開課:線性代數

有了以上的基礎,就可以進階學習數理統計了

優達學城Udacity 數據分析入門及進階,課程里的正態分布,抽樣分布,假設檢驗(t檢驗,z 檢驗)等,都講的很有邏輯性和條理性,本來枯燥生澀的理論知識變得脈絡清晰,填補了我大學期間沒上過統計課的大坑。

對於數據分析工作者來說,建立起完整的統計學知識體系是後期複雜工作的基礎,如果沒有紮實的地基,你會發現自己經常被困擾在實際工作中的很多細節問題里。

Ps:

由於針對的對象不是數理科班生,所以我的推薦基本上都是入門級資料,非常簡單易上手,誰看誰知道。

Step

4: 高階學習

畢竟是數據分析師,不是數學老師,學數理知識雖然重要,然還是為了打牢固數據分析的基礎。慢慢可以接觸一些數據分析,數據挖掘,機器學習的內容

推薦一: 《SAS編程與數據挖掘商業案例》—我第一次接觸數據挖掘的內容,如果想練練SAS這本書也是不錯的選擇,有完整商業案例的分析,代碼數據都有(最後一章文本挖掘木有數據,所以我就轉戰python

,哈哈哈慶幸! )

《數據挖掘導論》內容更多更全,需要一定基礎

推薦二:視頻課程,數據分析方面,現在有很多平台賣課程的,基礎班,應用班,項目班。。。是有你不想看的,沒有他不講的

總結一下

從入門到進階需要學很多東西,自學一般很難堅持下去,所以我推薦選擇網課學習。在我大四刷網課成癮的日子裡,我首先在

Udacity(國內叫優達學城)上開始學數據分析的。(這裡有課程介紹:https://cn.udacity.com/dand/?utm_source=wenkesheng1_zhihuutm_medium=KOLutm_campaign=DAND)

最初是被他們矽谷的授課老師吸引過來的,他們把握全球數據分析工作的脈搏以及發展方向,真正讓我有了一種站在巨人肩膀看世界的感覺。從數據分析入門到進階,我在優達里刷網課到手軟,攢了幾張矽谷認證的納米學位證書,都成為了我日後面試的加分項。

因為優達對我的影響比較大,所以此處僅以優達為例,市場上賣網課的平台很多,但優達是我見過質量最高的課程之一,尤其是代碼審閱的服務很贊(這個一會再說)。

b. 分析工具系:Python,SQL,Excel,Tableau

學習工具最好的辦法就是頻繁用它,變著法兒用它就行了,千萬不要抱著一本《XX語言/工具大全》然後從頭讀到尾,這樣不光啥也沒記住,還會打擊積極性。

分析工具Python

如果你是想做技術型分析師,然鵝編程基礎為零,要從頭開始的話,我建議你直接上python,

她的優點可以自行百度,關鍵你不用怕學不懂,畢竟小學生課本里都已經加上python了。。。

我用過很多分析軟體,SPSS,

stata(計量經濟的懂),SAS,R,Python最後我選擇將自己交給python,用PyCharm碼的code,至今還沒發現不適。

Step

1: 基礎知識還是要的

網上有很多python

學習路線,可以參考,但具體還是看自己情況。

推薦:廖雪峰-python基礎教程 –入門很好的學習資料

python簡明教程中文

《head

first python》

優達-計算機導論 -

講的系統又有邏輯,對小白很友好

Step

2: 照葫蘆畫瓢攢經驗~

我是從爬蟲開始接觸python,網上很多論壇, 像伯樂在線CSDN等等,很多大神做好的現成的case, 先從簡單的開始,模仿別人自己爬幾次。

不一定都要從爬蟲開始,但模仿現成的case,多熟悉代碼的寫法和一些庫的用法

Step

3: 開始做自己的case吧

Python畢竟只是個工具,工具本身並沒有什麼好研究的。現在可以找到自己的興趣點。然後自己制定分析計劃,開干吧!

推薦一:書《利用Python進行數據分析》《Python數據分析基礎教程:NumPy學習指南(第2版)》這兩本書對你理解python

數據結構,數據處理很有幫助。

推薦二:百度百度百度!網上有所有你要處理的問題的解決方案,但必須是自己一點一點摸索,這是積累的過程。

推薦三:help()

,沒有什麼比python自己更懂自己。

推薦四:優達的數據分析課程里有很多case可以做,並有項目評審系統為你指出思維上的不足。

最初作為編程零基礎的小白,努力學習如何在SQL里擺弄數據,如何用python進行數據清洗,其實內心是崩潰的。因為代碼這東西說實話,無論看別人碼過多少遍,都不如用自己的思路上手碼一遍學的快。

我當初在優達的數據分析課程里,做的第一個項目是用python對美國三個城市的共享單車行程數據進行數據分析,我將自己吭吭哧哧寫出來既潦草又不合邏輯的代碼提交後,很快就收到了評審老師的修改意見,清楚的指出了項目中的邏輯漏洞以及不規範的語句。於是我申請了一對一的

code review,老師擼代碼的風格重新定義了我的三觀,哇,原來代碼可以寫的這麼簡潔優雅!將代碼寫的規範會受益終生,很慶幸我能在學習初期就養成了這種習慣。

資料庫語言SQL

SQL是必備技能,w3school

上過一遍,加上平時反覆使用,簡單易學

對了,head

first 也有SQL ,沒看,但據說評價不錯

日常Excel

Excel

掌握好基本操作,lookup,

sumif等常用的公式 ,

會拉pivot

table,已經解決了至少70%問題。 其餘高階學習內容,網上課程太多,大家看心情挑選好了。

可視化Tableau

學習資源很多,不過我還是比較推薦tableau官方推出的課(在Udacity上有:https://cn.udacity.com/course/data-analyst-nanodegree--nd002-cn-advanced/?utm_source=wenkesheng1_zhihuutm_medium=KOLutm_campaign=DAND)。自己可以弄點數據,多拉拉拽拽,體驗不同圖形展示的特點,關鍵是要把你想表達的東西說清楚。

· 熱兵器Soft

skills(A型數據分析師必備)

a. 分析思維(非常重要!)

思維方式決定一個人,分析思維的能力強弱也決定了一個業務型數據分析師命運。

提到分析必須提麥肯錫,推薦《金字塔原理》《麥肯錫問題分析與解決技巧》

另外還有一寫管理諮詢會看的一些case

book:麥肯錫案例分析Ace

your case
Case in point

哈佛案例學習

case study handbook

同時要多與同行交流,一起參加比賽做項目,都會對思維的快速提升有很大幫助,編程不是一個人在戰鬥。優達band里經常策劃一起擼kaggle,贏獎金,比賽過程中我從業界大牛身上學到了如何用專業思維思考問題~

b. 業務理解

你要了解的:

1. 公司自身商業邏輯,企業定位,品牌優勢,客戶屬性…

2. 競爭企業有多少?什麼情況?優劣勢分別是什麼?所在行業什麼情況?

3. 交叉行業有多少?整體情況如何?

從哪裡了解:

媒體網站:比特網 、雷鋒網 、i黑馬、 創業邦 、億歐網 、36氪 、投資潮 、百度百家 、虎嗅網 、品途商業評論

……

報告網站:艾瑞諮詢

Useit知識庫 金融機構行業研究報告

行業協會,企業官網,公司財報等等.途徑很多,只要留心關注,積累的過程。

-----------------------------------------第二部分回答結束------------------------------------------------

三、最後羅嗦兩句

不管你是文科生也好,美術生也好,如果你有自己想做的、感興趣的事情,儘管去做好了。上帝如果給你關上了門,你可以撬開啊~哈哈哈~


大多數數據分析工作難道不就是文科?

如果數據分析是理工科,那麼經濟分析,會計,金融分析都是理工科了。

如果是說在阿里巴巴這種地方搞數據挖掘什麼的就當我沒說。


文科生出身的牛逼數據分析師,我身邊認識一大堆.....他們普遍的特長是,對業務的透徹,和對人心的把握(數據是現實的投影)


如果要從事這個,一定是要啃數學和編程兩大硬骨頭的。想著靠excel和sql就能一直搞下去,那是給自己打雞血


作為一個財務金融系畢業(好久遠的事情),工作後做過後勤支援、前線業務市場開發、甚至創業管理團隊融資打雜,現在落腳成為數據分析師的人,我想這問題我可以來回答一下。

題主的問題,讓我想起了我爸:在那航太物理盛行的年代中,他自然選擇了物理作為他的專業,但後來偶然接觸到了經濟學,大三大四後就逐漸和物理漸行漸遠,並越來越對經濟學和背後對於人類社會的影響感興趣。雖然他最後加入了營造相關的行業而沒有成為一名經濟學家,但他從本科到工作的轉換與心態深遠的影響了我:不要受限於自己的背景,機會來了就要抓住,就像題主這樣,抓住熱點,有心並且決定付諸於行動,邁出了很不錯的第一步。

至於提到工作內容一直是數據整理的「表哥」、「表姊」,又看不懂統計理論和具體工作有什麼關係,我想有個點是你必須要想明白的,就是你目前想要解決的問題是什麼?明確自己的目標可以保證自己在之後的實踐中不至於偏離自己本身的目標。當你明確了目標之後,就要思考另一個問題,你公司這些數據,究竟可以拿來解決什麼問題?哪些數據是你可以拿來使用,解決你想要解決的問題的?哪些數據可以經過怎樣的處理,用來解決你的問題?應該從可以解決什麼問題出發而不只是從用什麼工具解決問題出發,不然就會是滿手武器卻不知道對手在哪的吃雞玩家。

舉例如果是銷售相關的數據,需要關註銷售情況相關的數據:在什麼時候買了什麼產品?購買的頻率如何?購買的數量和金額如何?這些問題最終可以協助公司設立和執行更好的銷售策略。如果是網站數據,可以看看造訪者的行為數據,從什麼地方來?在網站裡面的哪一層頁面停留了多久?這些問題則可以用來優化公司的網站架構、購買流程等等。

確立問題後再回頭找工具:市面上的工具很多的功能都是重疊的。例如SAS, Python和R都是可用來建立描述性統計或是較複雜的預測模型,獲取知識的渠道很多,但是很多時候信息量太大,不知道怎麼篩選和選擇對自己有用的,並且不同渠道可能良莠不齊,知識內容不成體系,所以我個人更傾向於成體系的付費課程,相當於幫我們做了一層篩選和選擇。no pain no gain,我自己的經驗是付費的還是比較能激勵自己向上學習。

這裡講個我自己學習數據分析師時學的課程:Udacity 數據分析納米學位 ( https://cn.udacity.com/dand/?utm_source=wenkesheng2_zhihuutm_medium=KOLutm_campaign=DAND)

Udacity 創辦人也是Google的一位大佬,還是斯坦福計算機科學的教授,就是那種技術又厲害,又會教學的人。主打課程是數據分析、機器學習之類的,講師大部分都來自Google這種級別的公司,或者MIT這種級別的學校。數據分析課程是和 Tableau 這樣的企業合作開發的,課程內容可以說非常權威。

由於進入了中國市場,所以本地化是三個MOOC中做的最好的,所有課程都有中文字幕,從服務上來講也是我學過的課程中比較滿意的,Udacity有助教、一對一輔導以及社群等,學員間以及學員與講師的溝通都比較容易,並且課程內容對新手更友好。

除此之外,還推薦給題主一些線下的實體書籍(我還是喜歡畫畫底線做筆記的)。在資訊爆炸的時代,要快速的去蕪存菁,選到自己合適的書本也是一項重要的技能。

根據題主的描述,我認為一本能夠教導人在商業場景應用數據分析的書籍是能夠幫到題主的。如果你看一本書,封面寫著big data xxx,打開到目錄寫著這樣的內容,那就可以知道這可能是本假日優良讀物,而不適合用來工作上應用。

也會有一些書表面看起來是應用為主,但書中卻充滿代碼,這類書通常在開頭或是書名中就會告訴你作者是用什麼程式語言來進行數據分析的,除非你已經了解這種語言,不然這種書看了可能也會越來越蒙。

統計這門古老的學科也是存在很長一段時間了,就連貝耶斯理論都有書可以專門介紹之,題主應該也不是這路線的

這兩本書,是我過去半年裡面,對接應用與實作最好的兩本書, 希望題主可以繼續順風向上!


高中文科,本碩經濟,不知道是否符合文科生的定義。 目前在職數據分析師。

首先,這不是特別難特別不可思議的事情。沒瘋,很正常。

然後,數據分析首先是分析,邏輯清楚是第一位的。明確分析的目標,選取可以達成目標的方法是分析前的重要準備,但這兩條都不是用數據實現的。

使用數據前要對數據有足夠的了解,知道底層表裡的一條條記錄跟前台業務是什麼對應關係 ,這個要求對業務的邏輯和數據存儲的邏輯都要清楚。

最後才是數據處理方面的要求。

SQL是基本,不過周圍有很多分析師,包括我,是工作之後才開始學的,邊用邊學很快的。

統計學不用特別高深,但基礎要比較紮實。《統計陷阱》可以看懂就行。

會各種軟體也挺好,但目前用的最多的其實還是Excel的數據透視表。。

邏輯清晰的話,工具軟體可以幫助提高效率,邏輯不清晰的話,會再多工具也沒法產出一份合格的分析報告。

簡言之,邏輯&>業務&>數據處理能力

要有好奇心,或者叫腦洞要夠大,不過要從業務出發。

要是再會講故事,可視化也不錯,就是一個很優秀的數據分析師。


我覺得一個長跑運動員要把自己雙腿無緣無故砍掉才是瘋了。


做數據分析得把統計和編程兩塊學好吧,題主需要用最短的時間把別人至少兩三年學的東西都學完。

我覺得至少得先去閉關一年,把數理統計 概率論 和之後的線性回歸 所有的知識都補齊。

可汗學院是個不錯的選擇。

編程這一塊也不輕鬆啊 雖然不需要多精通 但是想要做到能用我覺得也得花半年時間來學習。

樓主好運 。不是不可能做到,不知道你是否有這個毅力。


看到你的提問差點哭了!!正是我迫切想問的!是個文科生也就算了,還是個從小就討厭數學到大的文科生也就不能忍了,結果還在最後滾到了數學系學統計(經濟統計,我們專業的原本都以為是經管院的,呵呵噠)一萬隻草尼馬踏過呀,咋滴這麼命苦呢!想死的心都有了……

———————————————————割割割

軍訓時本來可以轉專業的,但是我們學校會計是專科的,再加上高中政治女神(我們都認為智慧人物)的意見就留下了。上專業基礎課的時候,感覺腦子完全不夠用呀,各種符號,各種長長的公式,各種抽象,還有理課能學的數學文科狗不學呀!默默的看著理科生於老師默契的交流,自己像從別個世界來的一樣!這學期忙炒股呀,上課也沒聽過(雖然聽也是懂很少),感覺各種荒廢呀!數學還是環環相扣呢所以現在準備好好給自己補補腦了,乾巴爹~

$ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $分割割割

我覺得呢,經濟統計還是個蠻有搞頭的一個專業,數據分析在企業發展是很需要的,數據挖掘也是!但是現在國內沒有多少數據分析,挖掘水平高的。數學是黎明前的黑暗,試著乾乾吧,市場需求越來越多了。 數據分析行業絕對是一個朝陽行業,特別是互聯網的不斷發展,一個不談數據的公司根本不叫互聯網公司,數據分析師已經成為一個互聯網公司必備的職位了。

我才大一,還沒上專業課,但是大概了解用什麼軟體,市場需求,數據分析難度,說不出什麼有水平的東西,真不好意思。推薦個微信公眾號吧,專門講數據分析,數據挖掘的~數據海洋(dataplayer)可以去那裡裝逼,傲遊到天黑

你有沒看到最後呢,嘻嘻~


樓上一群誤人子弟,數據分析最重要的是業務,業務為王,不懂業務分析個屁


推薦閱讀:

大數據時代的來對公共衛生和預防醫學領域會造成哪些可能的影響?
R能做哪些stata不能做的事?
如果掌握了大數據,能不能預測股市?
中國的大數據中心有哪些?為何新的中國的大數據中心選貴陽?
為什麼蘋果會選擇在貴州建立大數據中心?

TAG:數據分析 | 數據分析師 | 大數據 | 商業數據分析 |