python操作excel求和

這裡介紹如何用python來自動完成我們的excel工作。

本文的目的是展示一些常見的Excel任務,以及如何在python pandas中執行類似的任務。例子微不足道,但重要的是通過這個例子來循序漸進的介紹pandas簡單到複雜的功能。展示pandas如何利用Python的完整的模塊系統做一些簡單的文字處理。

自動求和

數據如下:

原始數據截圖

第1步,求出每一行數據的和,並作為一個新列附加到數據中。在excel里,可能用公式是sum(A2:E2)。

在這裡,這功能就可以用pandas的dataframe來解決。這裡簡單說下dataframe,我們簡單認為,dataframe就是對應了excel的數據結構,我們操作的時候,就可以認為dataframe就是對應excel的操作。

第2步,對P1~P5的每一列做一個求和。在excel里是用公式,SUM(G2:G16).python對應解決方案是用 pandas的對應列,然後直接求sum即可。

第3步,對第一列求和,平均值,最小值,最大值。

程序邏輯如下,讀入excel,然後按行求和,把求出所有行的和作為一個新列加到數據里,為防止破壞原始數據,寫入一個新的excel文件,接著在python運行結果里顯示對數據的操作結果。

程序如下:

python代碼

運行結果如下:

讓我們看看新生成的excel.

新生成的newxls.xls表格

只需要這麼幾行代碼,就完成了讀取excel,然後對P1,P2,P3,P4,P5求和,平均值,最小值,最大值,並寫入新文件的功能。

第17,18行代碼,把求各行和的結果寫入一個新的excel文件,名字為newxls.xls,並指定寫入第一個名為0的工作表中。

其中14行代碼中df.head()使用head()函數查看列表前幾行數據(默認是前5行),如果我在括弧里寫3,結果只會顯示前3行,如下:


推薦閱讀:

王寶強事件的數據分析
如何高效地使用RStudio?
會游泳和不會游泳哪個溺死的概率大?

TAG:Python | Excel使用 | 数据分析 |