【技術】如何對多文件夾下數據進行高效優雅的處理——合併,拆分,轉碼?

本文主講——

如何對分布在多文件夾下的多個文件,進行高效的數據處理。實現對數據的合併,清洗,拆分,轉碼等。

本文以聯繫人數據為切入點,因為小馬哥寫此文的主要目的,就是為了配合"微信加人腳本"與"簡訊群發器"的使用。想要了解這方面的朋友移步小馬哥的文章列表。知乎用戶

合併清洗數據

必須要用到,PowerQuery,這個Office里的王霸插件。PowerQuery,字面含義即為"超級查詢"。在這一方面,知乎寫得最好最詳細的,當屬雷公子。小馬哥平時對數據處理需求不大,用過一次就忘一次,基本上忘了就跑回去再看一遍,233~

雷公子:如何不加班完成上百份Excel報表的合併(PowerQuery文件夾合併)?

zhuanlan.zhihu.com圖標

在這裡補充一下,要用到PowerQuery,不能用wps,而必須是office,而且必須是office2013及以上版本。

貼心奉上鏈接:Microsoft Office2016官方下載 免費完整版(附激活密鑰)_Office2016簡體中文版 - 系統之家 這個下載網站比較靠譜,沒太多廣告。

處理前,數十個文件夾,數百個文件~

處理後,一個文件~

一般來說,能夠把多個文件夾下的多個文件,合併處理成一個文件,已經能夠滿足絕大部分朋友的需求了,但是某些情況下,你還需要對已經合併的文件按固定的行數,進行重新的拆分。怎麼辦?

拆分數據

如何按行數拆分成固定行數的多個子文件?

1,VBA方式。excel按照固定行數拆分多個 - CSDN博客 但這種方式,只能拆分成.xls和.xlxs這兩種格式,且對使用者本身有電腦操作能力的要求。

2,而PowerQuery無法實現對文件進行拆分,那怎麼辦?小馬哥思考了幾秒鐘,決定自己寫個文件拆分器。花了三天,終於寫出來了,目前支持對.csv及.txt的文件進行拆分。

軟體說明

功能設置

設置文件路徑,選擇要拆分文件格式,以及行數。點擊啟動,等待執行完畢即可。

以我個人的經驗,總表36519行的數據,按每個文件固定200行,大概30秒能夠拆分完畢。這個數據量和速度都是蠻不錯的。


絕大部分情況下,已經將數據合併、拆分,就已經OK了。但如果此時你還需要對文件進行轉碼?因為如果編碼格式不對,那很有可能打開就是亂碼,數據是用不了的。怎麼辦?

數據轉碼

同為程序猿的朋友,對編碼問題應該比較熟悉,處理起來也很順手;但如果是普通朋友,只想簡簡單單地處理掉這個問題呢?難道只能一個一個文件打開,另存為,那不累死?

不要怕的,有現成的工具可以用,而且超方便的。

隨便百度下載個editplus的文件編輯器。

第一項,百度下載鏈接 baidu.com/s?

* jingyan.baidu.com/artic

多文件批量修改編碼

1

打開editplus,在右側列表中打開需要修改的文件(所有打開的文件都可以同時修改編碼),然後滑鼠全部選擇上。

2

Document(文檔)->file Encoding(文檔編碼)->Convert Encoding Multiple(更改多重編碼方式)

3

前面的步驟確認後,出現對話框,在按住Ctrl鍵的同時選擇需要修改編碼的所有文件,然後點擊ok。

4

再出現的對話框里選擇需要轉換對應的編碼,點擊ok即可完成。

返場小段兒

1 如何獲得此"Excel文件拆分器"工具?

鏈接:pan.baidu.com/s/1KhXimR 密碼:6ji2

至於點贊、收藏、留言的事,就拜託各位了~

2 想要了解更多關於簡訊王和微信加人腳本的信息?

添加小馬哥個人微信,拉你進群了解。

3 小馬哥微信號:xiao_mage008


推薦閱讀:

分享優米雲盤實用功能
文件很多很雜,求國產雲同步軟體推薦?
用這個小工具批量修改文件名,可以提高你80%的工作效率!
每個人都應該學會正確地管理文件
Windows 的文件層級為什麼這麼混亂?

TAG:數據 | 文件管理 | 通訊錄 |