如何才能成為EXCEL數據處理大神?
計算機小白,數學超差,卻從事數據分析助理,所在職位要求通過EXCEL進行數據處理分析,想精通EXCEL數據處理,求好的學習方法推薦!!!求幫助
在加入諮詢之前,基本不會使用Excel,因為在我們這些工科碼農男和實驗男眼裡,Excel簡直是太Low了,平時都是使用Matlab或者直接寫程序計算。後來通過自己的練習,無論在諮詢投行還是基金公司,Excel水平都能達到較高水平(以知乎回答何明科:Excel 有哪些可能需要熟練掌握而很多人不會的技能?為證),其實核心就兩點。
第一點是勤學苦練。最開始使用Excel的時候,恨不得算好數據往Excel裡面填寫,但是堅持不懈得使用,同時不斷用F1幫助和搜索引擎查詢,技能得到飛速長進。同時發現Excel是神奇而並不Low,之前對Excel的誤解只是因為自己的無知,以前許多編程做的事情,其實完全可以用Excel更高效更漂亮得完成。
第二點是精益求精。特別認可團隊某程序員的名言,「任何事情同樣做上三遍,一定會想辦法用程序來自動化。」這句話換到Excel做數據處理同樣成立,一個清洗、一個分析以及一個模型框架等等,可能在工作中會反覆發生。每當再次遇到同樣問題的時候,不是屈從於慣性或者傳統,用老方法再做一次,而是探索能否用更高效更美的辦法來實踐一次,哪怕第一次使用新方法的時候極其曲折和低效,但是會換來未來的效率幾何級數的提升以及自己能力的加倍提升。我當時就從最初級的函數開始,然後發現各種高級函數以及能處理多重向量的數組函數,隨後又發現宏以及VBA巨大的天地,最後還有python+xlwings等神器。每探索一個新領域,不僅會為自己打開一片新天地,而且反向會加深對原有知識的理解和靈活運營能力。
…更多文章請到數據冰山 - 知乎專欄
…更多回答請看何明科
瀉藥~
對於入門小白,建議從excel工具入手
學習Excel也是一個循序漸進的過程
- 基礎的:簡單的表格數據處理、列印、查詢、篩選、排序
- 函數和公式:常用函數、高級數據計算、數組公式、多維引用、function
- 可視化圖表:圖形圖示展示、高級圖表、圖表插件
- 數據透視表、VBA程序開發
按照我習慣的方法,先過一遍基礎,知道什麼是什麼,然後找幾個case練習。多逛逛excelhome論壇,平常多思考如何用excel來解決問題,善用插件,還有記得保存。
函數和數據透視表是兩個重點,結合業務場景來學習,可參考《誰說菜鳥不會數據分析》。
製作數據模板必須掌握的excel函數
- 日期函數:day,month,year,date,today,weekday,weeknum。日期函數是做分析模板的必備,可以用日期函數來控制數據的展示,查詢指定時間段的數據。
- 數學函數:product,rand,randbetween,round,sum,sumif,sumifs,sumproduct
- 統計函數:large,small,max,min,median,mode,rank,count,countif,countifs,average,averageif,averageifs。統計函數在數據分析中具有舉足輕重的作用,求平均值,最大值,中位數,眾位數都用得到。
- 查找和引用函數:choose,match,index,indirect,column,row,vlookup,hlookup,lookup,offset,getpivotdata。這幾個函數的作用不用多說,特別是vlookup,不會這個函數基本上複雜報表寸步難行。
- 文本函數:find,search,text,value,concatenate,left,right,mid,len。這幾個函數多半用在數據整理階段使用。
- 邏輯函數:and,or,false,true,if,iferror
(以上學會,基本能秒殺90%的辦公室白領。)
數據透視表
數據透視表的作用是把大量數據生成可交互的報表,數據透視表具有這樣一些重要功能:分類匯總、取平均、最大最小值、自動排序、自動篩選、自動分組;可分析佔比、同比、環比、定比、自定義公式。
參考:怎麼培養數據分析的能力? - 知乎專欄
更多文章請到數據化管理 - 知乎專欄
其實進入到數據價值挖掘領域,EXCEL是最基礎的工具。大神可以拿它做數據管理、分析,做可視化,小白也可以就把EXCEL當成一個數據池。至於後續的數據處理、分析、指標計算,都可以藉助性能更高、正確性更高、效率也更高的「三高」產品來解決。最後,把你處理過的數據再導成excel,你就是大神。不,你是超越大神的神。
這個工具就是ETL,E代表著extract,抽取,對應到你的業務場景,就是把你需要處理的數據/欄位抽取到工具中來;
T,代表著Transition,轉換,對應到你的業務場景,就是各種清洗數據、行轉列、計算、分組聚合之類。
L,代表著Loading,載入,對應到你的業務場景,就是把整理過的數據導出來。
跟excel不一樣,它的界面特別友好
先把流程拖到畫布上,就絕對不會出現,數據正處理一半兒,被別的工作打斷了,回來之後思路都亂了的情況。
跟excel不一樣,它的操作特別簡單
以前在excel裡面想要列轉行,需要剪切、複製、選擇性粘貼、轉置等好幾個動作,在這裡,拖入一個「列轉行」就行;
其它數據處理的動作也是如此,它是需求導向的,你拖入你的需求,然後進行設置即可;不用再在excel特別繁雜的各種按鈕中一步步地挑選了。你需要做的只是明確需求,然後讓它執行。
跟excel不一樣,它的速度特別快
excel處理少量數據還ok,一旦數據量大,對電腦、軟體本身都是挑戰。就算老天保佑中途沒崩潰,等候的時間也是一種煎熬。
這個工具就不一樣了,它底層依託的是世界級資料庫GBase 8a MPP分散式資料庫,可以做到tb-pb級的數據秒速響應。你在一萬行銷售數據上扔一個超級複雜的函數,立刻就能得到運算結果。你在結果上面再扔一個炒雞複雜的函數,還是立刻就能得到結果。
不崩潰,不等候,不擔憂。
最後丟一個gif感受一下^_^
它就是我們公司都在用的:數據觀|新一代商業管理雲 其中的一項功能:數據處理
其它還有數據連接(連接各種來源的數據到數據觀,並自動更新),數據視覺(把你的數據變成各種精美的圖表,並且可以過濾、下鑽),數據協作(開著圖表跟相關的工作夥伴聊天,基於數據溝通工作中需要優化的環節或者為活動復盤)
很強大很好用,會用滑鼠就行了。
感興趣可以嘗試,你處理之後的結果可以導出成為excel格式,誰也不知道你到底是怎麼辦到的,做大表比大神還快。
看看我寫的免費電子書不就好了
==============
1.不吐不快
作為自由市場經濟的忠實信徒,我從來信奉下面這句話:
生產者和生產者競爭,消費者和消費者競爭,生產者和消費者從不競爭。
因此,我無需過度關注我的潛在讀者的所有需求,只需要看看現有線上知識輸出者的當前水準即可。這麼一看不要緊,我的對手很弱雞啊:
- 丑成翔。我一直堅信,知識輸出的第一條就是好看,好看就是第一生產力。好看有兩層意思,一是顏值要美,要讓眼睛爽;二是文字要有趣,要讓腦子爽。很遺憾,現存的知識輸出絕大部分都是辣眼睛的,更不用說文字的乾癟無趣了,我懷疑大部分作者是被人拿刀子逼著寫字的,否則怎麼會那麼生澀無聊呢。一丑遮百好,我只要比他們有趣好看,我就甩開至少三分之一的人了。
- 唬成狗。放眼望去,全是UC震驚部出來的嫡系。看看那些嚇死人不償命的標題「震驚!不學會這十個技能會死」、「震驚!升職加薪必須關注的十個功能」,「震驚!戈壁老王給這個功能點贊」,我被嚇成狗了好嗎?求放過。我相信這個世界上的大活人還是理性人居多,我可以不用嚇唬,不用震驚,也能輸出高效高價值內容。
- 碎成渣。我親愛的讀者朋友(敲黑板劃重點,我可以吐槽無數次我的競爭同行,可是我可不敢得罪我的讀者半分啊,你看,儘管你可能今天才第一次關注這個公眾號,可是我親愛的就敢叫出口了),你們有沒有發現,關注了那麼多公眾號,參加了無數次直播,進入了無數個討論群,遇到實際問題你還是呆若木雞?那是因為你的知識是零碎的,碎片化的,不成體系的。你沒有全局觀啊少年,你的知識全是一個個的點,沒有體系化的構建 知識體系 明白嗎?而這,正是我的強項。
2.我行我上
打壓過競爭對手,爽過嘴皮子之後,我想我不該停下,我現在顯然會乘勝追擊,說說「為什麼我行」這個問題。簡單回答:I CAN I DO,我行我上。
- 線下培訓經驗。在寫這本書之前,我已經有了若干年線下授課經驗了,同樣的一套EXCEL培訓課,我在講授過程中,每一個知識點我都感受過在我對面真實的學員的表情:若有所思的點頭,張開大嘴的迷惑,前仰後合的笑意,嘴角抽動的痛苦......而現在不少線上寫作者甚至終生在寫作中是沒見過活人的。
- 軟體研發經驗。坦率的說,這一點對我的同行並不公平,很多在coder眼裡極其自然的事情(比如數據源對標題和ID列的要求是典型的資料庫思路,比如PowerQuery是很簡單的SQL應用,比如為什麼有些功能是放在「視圖」主菜單下是典型的MVC思維),這些事情有了研發經驗很容易說的清楚,而我的同行們並不知道。[攤手]。
- 智商碾壓。嗯,這個很容易政治不正確,不展開了,你懂的。
- 略懂審美。不自誇的說,在審美這個層面上,在對細節的死磕上,我剛邁開左腳出發,我就贏了。不信你去看看我的講義PPT,不信你去感受一下我的微信公眾賬戶排版(比石頭還硬的硬廣告來了,請關注微信公眾賬戶 怒馬說(numashuo) 看看我是不是吹牛),至於細節,隨便說幾個好了,第一,微信公眾賬戶的markdown樣式文件我調整了不下20次,現在這個樣式是唯一的,好看的,妥帖的。第二,這篇文章快要寫完的時候,我發現無序列表的文字部分變色沒有包含句號部分(比如這段文字開頭的「略懂審美」四個字後面的句號),我就全部又改了一遍.....偏執於好看,偏執於細節,偏執於不說你永遠都不會發現的細節!
- 節制,節制。這個公眾號永遠不會放文末的那種所謂流量主廣告,無他,唯丑而已。這個公眾號不會推任何主題無關的廣告,沒什麼原因,哥哥不差錢。
- 精品戰略。這本教程的每一篇文章都是有編號的,每一篇文章都是限量版,我沒有興趣和精力無休無止的寫下去,我只能保證每一篇都是精品。一萬篇垃圾比不過一篇好文章,我不會和任何人比所謂高產,同樣是漢字,質量是不同的。
3.全書結構
這本書初步規劃五章(多乎哉?不多矣),當然不排除寫作過程中我改主意增減。目前五章大致這樣分配內容:
- 第零章。洗腦篇,講格局,講方法論,講思維,講軟體背後的思想,同時也會就運行環境及行文約定進行說明。儘管每一章都重要,但這一章尤其重要,請務必把每一個標點符號都讀進去,
- 第一章至第四章。硬知識。按照我的思想將整個知識體系分成「點線器面」四個字掰開了揉碎了烤熟了講給你聽,四章帶你武裝到牙齒。
- 第五章。飛升篇,我會將壓箱底的部分要點整理出來,帶你面向未知的未來,帶你應對未知的問題,即使EXCEL更新到2046版,這些知識都是可用的(為什麼是2046不是2146?除了電影梗以外,2046也是一個可見的年份,我能活到那個時候和你一起見證我吹過的牛逼)。
好了,請繫上安全帶,帶上智商和注意力,和我一起出發。
關注公眾號「怒馬說」,閱讀更多更及時教程。
怎樣才能用自行車成為秋名山車神?
這問題太特么簡單了。
練。
給你一個10萬行的商超終端零售掃碼數據,整理成SKU銷售統計。從抓耳撓腮、絕望至極的一周做完還滿是錯誤,做到半天完成、整齊有序,就差不多啦!
有ddl壓著更好!
沒體會過做excel表格被逼哭的人,不算活過。
老紙當年就是這麼過來的,當年帶我的小姐姐說,不用滑鼠完成這樣的表格,你就可以出去裝B啦!後來,人家路過我的工位,看我盯著屏幕不眨眼的樣子,說:「你看他好像一條狗誒。」題主問得比較寬泛,只能說excel是門手藝活,用多了自然熟練,某匿名答主回答也片面了點,以下是個人理解:
數據分析不見得都是大數據的分析,excel雖然不是為了處理大數據設計的,excel勝在小巧靈活,介面功能豐富,以及在桌面級應用用普及率最高,在小型數據處理,以及大型數據細分後的處理有著無可比擬的優勢。三步走
①發現問題建立一種思維:在日常生活中,牽涉到數據的,需要重複操作的工作,都是可以用excel簡化流程,降低工作量,提高工作效率的。②解決問題知道了要去解決什麼問題,再去excelhome上去搜搜解決方案,拿回來自己套用,套用的過程中搞清楚公式的原理,函數的使用方法。③提出解決方案
不是函數學的越多越好,我自己平常使用的函數就是就是那麼十幾個,通過組合也能解決大部分問題了。搞清楚客戶的需求,明白數據的邏輯關係,再加上靈活組合,就無往而不利。昨晚在一個朋友家,她做快遞的,平時下載下來的流水報表,然後對著流水報表,一行一行的計算快遞費用,一個月1萬多張單子,要算好幾天。我先做了一張「快遞資費表」,裡面有不同的客戶,不同區域的首重和續重的價格,又做了一張「計算表」,裡面自動設定了計算公式,朋友每天下載「流水報表」後,按照順序打開「快遞資費表」,「流水報表」和「計算表」,計算表裡面自動就把1萬多條的單子的快遞費自己算好,全程不需要三分鐘。Excel只是個工具。不建議抱著本Excel經典教程從頭到尾地看。50%的教材知識你工作中都不一定能用上,90%的用不上的知識一般在一個月以後就忘光了。
個人以為,「數據分析」其實更應該關注的是分析和運用數據的能力。比如如何在一堆看似雜亂的數據里尋找規律,如何找到最有效的指標或KPI,如何將工作上的各種問題轉化為數學模型進行建模,或者稍微通用一點---如何用最快最省事的方法提供老闆每個月都會要的信息。
有了以上對數據分析的需求後,再帶著需求和問題去查詢用Excel如何實現。Excel是一個很完善的軟體,如果你發現自己在用Excel重複做一個的動作,那多半Excel都有個簡單的公式或者方法去幫你減少工作量。帶著問題去各大論壇搜索,比如Excel Home,大神很多,肯定能找到答案,得到答案後印象也會很深刻。
隨著數據分析能力的提升,數據處理的需求也會提升,Excel水平也會跟著提升,你會逐漸發現數據透視表不夠用了,你會學會各種數據規範來控制數據有效性,你會逐漸發現數組公式的優點,你會有一天覺得Excel的公式無法滿足你的需求於是決定開始學VBA。。。
你會發現自己永遠也無法精通Excel,但是你的工作效率已經越來越高了。Excel正在緩慢的發生一場質變,從數據量級、分析能力和性能表現這三個維度去評估,這個工具已經脫胎換骨。在中文世界,大部分人還沒有意識到正在發生的變化,或者存在一些認知偏差。人們對新事物態度總是相似的,看不見;看不懂;看不起;來不及。
網上流傳的一個問題是這麼說的:「怎樣才算精通Excel?」,函數+透視表+vba+作圖哪個都不能少,函數要會寫複雜的嵌套、會用數組公式;自動處理要會寫VBA;最好還要掌握XXXX。
我覺得,新工具的作用不是對已有功能的補充,而是替代。不需要Excel公式、不需要VBA,在Excel里實現之前不曾觸及的分析。
Excel 一億行數據分析實踐(總結篇) - 知乎專欄計算機小白,數學超差,卻從事數據分析助理……
樓主,其實我特別想問你,你是怎麼應聘上這個職位的?實力佩服
同事來跟我溝通Excel使用時,我都會問一句,這個你以前是用多長時間完成;嗯;我可以給你一個方法,只需要 1/10,1/100 ……的時間,順便請我喝杯飲料吧。
個人Excel學習路徑為:
Excel2007實戰技巧精粹 3遍
Excel 數據透視表應用大全 2遍
Excel VBA 無數本
Excel是工具,工具是實現人想法的手段,所以最重要的是——想法。
看提問者也是蠻著急的,我為你從戰術、戰略兩個層次來解答吧。
1.戰術層面——解決當前工作問題:
如上面說的,Excel只是我們實現想法的工具,所以先搞清楚部門的主要職能和業務,再找領導深入的交流,摸清楚上級所真正需要的結果是什麼,再制定下一步計劃。如果搞不清楚領導/上層的目標,就憑自己想當然的理解,現學現用的搞了一些網上的表格等,往往是事倍功半。
當你弄清了領導/上層進行數據分析的真正目標後,你就可以像做應用題一樣,一步步的逆推出為了達到這個目標需要哪些數據。對於這些數據還要有個判斷,拿員工加班數據分析來說:
(1)哪些是底層數據,是伴隨工作/業務自然生成的,比如員工每天都在加班,刷卡機的刷卡時間就是底層數據,是由刷卡機生成的。
(2)哪些是中間數據,是根據一定的規則、邏輯從底層數據變換、統計來的。比如認為員工19:00以後的刷卡時間是加班,加班時間=刷卡時間-18:00。
(3)哪些是常數、設定值,這些是按照公司制度規定的,一般不會變化的值,比如加班1小時10元錢。
當你在腦海中想到這個時候,你的思路就清晰了,你可以在紙上像做應用題一樣,寫出分析目標,再羅列出所需要的底層數據、中間數據和設定值,把它們之間的邏輯關係對應起來。剩下的無非是手段(Excel技巧)的問題,哪怕到這個時候你再來知乎求助就更能夠讓大神們有的放矢,你的問題也能夠迎刃而解。
2.戰略層面——Excel對於整個職業生涯的用途:
如果數據的分析只是提問者短期的工作需求,那麼下面這1段你可以PASS了。
有用的東西人才會去學,有大用處的東西才會讓那麼多各行各業的人去學習。我覺得Excel就是有大用處的工具。現在是信息時代,隨著生產、管理的運轉,會伴隨產生很多過程數據。數據往往不會騙人,如今對這些過程數據的分析是快速發現流程增值點、管理盲區、效率低下環節的有效手段,但現實是很多的部門還在使用非常原始的管理思維和方法,使管理僅僅是完成流程,而沒有產生增值。
Excel恰恰就是一個適合個人快速應用的部門級數據分析工具,這種數據解析、抓取、分析能力可以伴隨你一生。當有了需求,下面就只是方法的事了。學習Excel有點像武俠小說中的修鍊武功,有門派之分、也有邪教(haha),武功還分層次。
「學好一招一式,方可融會貫通」這就是我的個人體會。對於非數據分析專業(95%吧)的人,學好Excel足以,可以通過微信公眾號、知乎上有質量的答者來學習。在實際應用中鞏固,在實際應用中探索。推薦可以關注一下 @何明科 和他的專欄 @數據冰山 對於提升數據分析思維很有幫助。
說到底別忘了我在文章開頭說的:Excel是工具,工具是實現人想法的手段,所以最重要的是——想法。數據分析,這4個字已經被說得爛大街了,但真有多少人去做?會做?做得好呢?
祝提問者好運!
去泡excelhome,看那些問題和心得,然後自己動手,不要怕,別人會,你為啥不會呢?
誰說菜鳥不會數據分析基礎篇,這本書很實用,我也是用這本書開始數據分析之路的
在這介紹一個讓Excel運用更完美的工具:pandas,在數據格式不一且比較亂的時候,可以用pandas先進行處理,再粘貼在Excel中進行進一步處理,接下來你看到的回答就是推薦一個處理數據時的工具結合使用方法。
以下是我們豈安科技數據分析師的一點分享:
我的數據分析工作經常是在這樣的場景下開展的:數據格式五花八門,有些存儲在關係型資料庫內,有些則是 csv 或者是 json,而最後老闆想要的數據報告是 excel 版本的。
在沒有使用 pandas 處理數據以前,我會周旋在各個數據源之間,將取完的數之後黏貼到 excel 中,最終在統一在 excel 內進行處理。
這個操作有一些缺陷:
? 各個數據源取數方法不統一。自己掌握可以通過反覆操作熟練,一旦教授給新人需要花更多時間。
? 數據處理環節效率低下,易受干擾。在頻繁的複製黏貼中,很難確保不受外界干擾,一旦恍神了,很難想起剛剛的取數的一些細節。並且過多的複製黏貼可能導致excel崩潰。
? 問題排查難以溯源。仔細想來,excel承擔了打草稿的功能,在多次複製黏貼之後,沒有人會清楚記得每一步為什麼複製黏貼。一旦數據報告有誤,想要定位問題所在,常常需要從頭開始復盤。
?如果把數據的獲取到處理全部交給 pandas 呢?
這樣一來 excel 只負責最終呈現層面的功能。為了實現這些,除了 pandas 本身強大的數據分析功能之外,還得益於兩點:
1. pandas 良好的數據讀取介面
2. xlsxwriter
良好的數據讀取介面
一旦 import pandas as pd 了之後,就可以任意的 pd.read_json / pd.read_csv / pd.read_sql 了,是不是很方便?
example.json
[{
"teamName": "GoldenArch",
"distCode": 04,
"distArea": "Shanghai",
"month": 11,
"income": 16255,
"cost": 30250,
},
{
"teamName": "OldFather",
"distCode": 02,
"distArea": "Beijing",
"month": 11,
"income": 135300,
"cost": 27200,
}]
&>&>&>&>
結果
csv,相對省力,甚至可以用 excel 直接打開處理,不過這種方式影響到了這個數據處理方案的一致性。舉例略。
data_csv = pd.read_csv("example.csv")
結果和上面json結果結構是一致的。
sql,最複雜的一項,在 read_sql 之前,你還需要關心資料庫連接問題,和要處理的 sql 語句問題。
這裡我遭遇的坑在後者,如果你打算用 read_sql 打入 dataframe 的是一張大表,那麼可以暫時放棄這個念頭,因為在 read_sql 的過程中,雖然讀表很快,但是寫入 dataframe 的速度卻受制於數據規模,個人建議是,如果人類沒有耐心把這些數據一一讀完,那麼就不要打給 dataframe,至少在目前的 0.20 版本是這樣。不過好在我們可以在語句上做處理,在 where 之後按需做一些 group 或者 limit。
#資料庫連接部分
import pymysql
def getConn():
connect_config = {
"host":"0.1.0.1",
"port":8888,
"user":"myname",
"password":"mypassword",
"db":"mydb",
"charset":"utf8"
}
conn = pymysql.connect(**connect_config)
return conn
#實例化連接對象
conn = getConn()
#語句
sql = "select company, sum(totaAmount) from myTable where ... and ... group by company"
#最熟悉的語法
data_sql = pd.read_sql(sql,con=conn)
結果和上面 json 結果結構是一致的
這個環節最大的收益就是將所有來源的數據 dataframe 或者 series 化了,然後就可以統一用 pandas 功能來進行下一步數據處理工作。數據處理環節環節太龐大,本文不做描述。這裡我們跳過了處理環節,直奔 excel。
xlsxwriter
這個包的作用就是用 python 語法來寫 excel 文件,在把所有關心的數據都裁剪完成後,下一步就是把它們按需塞進 excel 中。
import xlsxwriter 之後,用三行代碼就能用 python 創建一個 excel 文件。
workbook = xlsxwriter.Workbook("helloworld.xlsx")
worksheet = workbook.add_worksheet(『made by xlsxwriter』)
workbook.close()
簡單吧,看字面意思就能理解——先創建文件,再創建表單,最後關閉。這是官網的文檔,但是卻不完全適用目前的場景。因為,我們需要藉助於 pandas 來寫,而不是直接寫。
df = pd.DataFrame({"Data": [10, 20, 30, 20, 15, 30, 45]})
writer = pd.ExcelWriter("example2.xlsx", engine="xlsxwriter")
df.to_excel(writer, sheet_name="Sheet1")
writer.save()
這也是官網的文檔,這兩種方法處理 excel 都可以,區別是前者是可以方便地指定打在哪些格子里,而後者是將數據作為一個整體的打入 excel,這裡更推薦後者。如果是多個不同數據源或者不同意義的數據,可以在 to_excel 的時候,新增一些 Sheet 來分類數據,sheet_name 參數,使得你能自如的掌控數據的內容。
所謂的塞數據也就是把你最終處理完的 dataframe 或者 series 交給了 excel,用 sheet_name 來管理不同意義的數據。
取數工作一般是周期性的,在數據需求沒有產品化之前,需要利用更高效的工具來壓縮取數環節所耗費的時間,將更多的精力留給數據分析之後結論以及建議上,畢竟分析才是數據價值。
上述方案比 excel+ 複製黏貼來的高效且可靠,既統一了數據採集方式,又使得取數過程可視化且易於維護。成本則是你需要花一些時間閱讀 pandas 和 xlsxwriter 的文檔,而 python 環境的搭建幾乎是零成本的。
附
- xlsxwriter文檔:http://xlsxwriter.readthedocs.io
- pandas文檔:http://pandas.pydata.org/pandas-docs/stable/api.html
1另存為csv文件2bash+awk+sed+grep或者read_csv(逃)
說下我的經歷吧,畢業那會匹配函數都不知道是什麼東西。一堆數據給到我,花了3天三夜也沒整理出結果,結果同事2小時就處理完了。啪啪打臉啊,遂發誓要把數據處理學好。幾年過去了,人稱公司數據處理一哥 也憑這個技能跳槽到行業NO.1的公司。買了一本excel書,基礎的那種,目的是對這個工具有個系統的了解,大概花了一個月的業餘時間。然後是重點,實操啊,一定要實操,vlookup summits countifs if mid 這幾個公式要用熟了。我是在部門制式的報表上實操的,先看別人怎麼寫,刪掉,重新寫,檢查異常,不懂的問百度。保證自己能把報表做出來先,再不斷製作報表的過程中不斷想辦法優化,找更簡便的辦法做完成報表。當公司制式的東西已經輕車熟路了,aql可以開始學了,沒錯再買本書,找個開源免費的DBMS,添加幾張表,跟著課本開始學SQL吧,一定要實際操作,我是跟著課邊學邊操作的,嗯,主要學檢索,高級檢索,函數計算,聯結這幾部分就可以啦。學到這裡就是一個數據處理方面的熟手了不過你未來的職業發展應該是數據分析,應該再學一些統計學知識還有數據分析軟體的使用吧
依靠excel成為數據處理大神? 你一直想知道excel怎麼處理千萬甚至上億級的數據,我覺得你可以考慮去學matlab python r語言可能更加靠譜一些,我反正是用python加mysql的小白,需要excel的時候用cvs導出
全部用鍵盤操作, 不要去用滑鼠, 基本就在大神的路上了
推薦閱讀:
※Excel中同一工作表內使用「插入剪切的單元格」功能如何始終保持原始列寬?
※excel表格百萬數據如何查重?
※excel中如何轉換數據?
TAG:數據分析 | MicrosoftExcel | 統計 | 數據處理 | Excel使用 |