Python數據分析及可視化實例之常規存儲txt、csv、xls
系列文章總目錄:Python數據分析及可視化實例目錄
『茴』字有三種寫法,我只講一種最簡單的!
1.TXT讀寫
# 逐行讀文本nf = open("test.txt","r") nlines = f.readlines() # 讀取全部內容 nfor line in lines n print(line)n
作業:open函數還有哪些常用的內建方法
# 逐行續寫文本nf = open(test.txt, a) # 其他寫入模式,如w等nf.write(0123456789n) n
2.CSV讀寫
CSV文件寫入方式:
# coding:utf-8nimport csvndef bs_test(text):n soup = BeautifulSoup(text, "lxml")n table_trs = soup.find_all(tr,{class:hover})n # 摘自前面爬蟲案例n for i in table_trs:n content=[ i_in.text for i_in in i.find_all(td)]n print(content)n with open(file_name.csv, a, newline=) as f: # 刪除空格n f_csv = csv.writer(f)n f_csv.writerow(content)n f.close()n
作業:字典(dict)或Json格式的數據寫入要用到csv.writer()的方法writerdict()。
# coding: utf-8 nimport csv ncsvfile = file(csv_test.csv, r)nreader = csv.reader(csvfile) nfor line in reader:n print(line)ncsvfile.close() n
我自己讀取CSV一般用Pandas開始做數據清洗了。
3.XLS讀寫
# 利用庫進行讀取,注意Office文檔前後版本不同,操作Doc文件也是一樣的。nimport xlrdnworkbook = xlrd.open_workbook(E:yeayee.xlsx) nbooksheet = workbook.sheet_by_name(Sheet1) nfor row in range(booksheet.nrows): n print(row)n
XLS寫入,不太用:
row = 0 ncol = 0 n# 類型 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 errornctype = 1 value = 單元格的值 nxf = 0 # 擴展的格式化 ntable.put_cell(row, col, ctype, value, xf)n
4.其他
其他數據格式的存儲可以自行搜索,系列教程最重都會用到Pandas清洗保存數據。清洗後的大型數據,則直接入庫:MongoDB。
膠水語言博大精深,
本主只得一二為新人帶路,
老鳥可去另一專欄:Python中文社區
新手可查閱歷史目錄:
Python數據分析及可視化實例目錄
最後,別只收藏不關注哈
推薦閱讀:
※西部數據和希捷的硬碟科技具體參數解析?
※為什麼以色列的網路安全,存儲方面這麼有競爭力?
※目前哪些國外雲存儲在國內沒有被牆?
※DRAM會怎樣發展? | 半導體行業觀察
※內存條改造為U盤可行嗎?