Python數據分析及可視化實例之常規存儲txt、csv、xls

系列文章總目錄:Python數據分析及可視化實例目錄


『茴』字有三種寫法,我只講一種最簡單的!

1.TXT讀寫

# 逐行讀文本nf = open("test.txt","r") nlines = f.readlines() # 讀取全部內容 nfor line in lines n print(line)n

作業:open函數還有哪些常用的內建方法

# 逐行續寫文本nf = open(test.txt, a) # 其他寫入模式,如w等nf.write(0123456789n) n

2.CSV讀寫

CSV文件寫入方式:

# coding:utf-8nimport csvndef bs_test(text):n soup = BeautifulSoup(text, "lxml")n table_trs = soup.find_all(tr,{class:hover})n # 摘自前面爬蟲案例n for i in table_trs:n content=[ i_in.text for i_in in i.find_all(td)]n print(content)n with open(file_name.csv, a, newline=) as f: # 刪除空格n f_csv = csv.writer(f)n f_csv.writerow(content)n f.close()n

作業:字典(dict)或Json格式的數據寫入要用到csv.writer()的方法writerdict()。

# coding: utf-8 nimport csv ncsvfile = file(csv_test.csv, r)nreader = csv.reader(csvfile) nfor line in reader:n print(line)ncsvfile.close() n

我自己讀取CSV一般用Pandas開始做數據清洗了。

3.XLS讀寫

# 利用庫進行讀取,注意Office文檔前後版本不同,操作Doc文件也是一樣的。nimport xlrdnworkbook = xlrd.open_workbook(E:yeayee.xlsx) nbooksheet = workbook.sheet_by_name(Sheet1) nfor row in range(booksheet.nrows): n print(row)n

XLS寫入,不太用:

row = 0 ncol = 0 n# 類型 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 errornctype = 1 value = 單元格的值 nxf = 0 # 擴展的格式化 ntable.put_cell(row, col, ctype, value, xf)n

4.其他

其他數據格式的存儲可以自行搜索,系列教程最重都會用到Pandas清洗保存數據。清洗後的大型數據,則直接入庫:MongoDB。

膠水語言博大精深,

本主只得一二為新人帶路,

老鳥可去另一專欄:Python中文社區

新手可查閱歷史目錄:

Python數據分析及可視化實例目錄


最後,別只收藏不關注哈

推薦閱讀:

西部數據和希捷的硬碟科技具體參數解析?
為什麼以色列的網路安全,存儲方面這麼有競爭力?
目前哪些國外雲存儲在國內沒有被牆?
DRAM會怎樣發展? | 半導體行業觀察
內存條改造為U盤可行嗎?

TAG:Python | 数据存储技术 | 数据分析 |