在數據分析中經常需要從csv格式的文件中存取數據以及將數據寫書到csv文件中。將csv文件中的數據直接讀取為dict類型和DataFrame是非常方便也很省事的一種做法,以下代碼以鳶尾花數據為例。
代碼
# -*- coding: utf-8 -*- import csv with open('E:/iris.csv') as csvfile: reader = csv.DictReader(csvfile, fieldnames=None) # fieldnames默認為None,如果所讀csv文件沒有表頭,則需要指定 list_1 = [e for e in reader] # 每行數據作為一個dict存入鏈表中 csvfile.close() print list_1[0]
輸出
{'Petal.Length': '1.4', 'Sepal.Length': '5.1', 'Petal.Width': '0.2', 'Sepal.Width': '3.5', 'Species': 'setosa'}
如果讀入的每條數據需要單獨處理且數據量較大,推薦逐條處理然后再放入。
list_1 = list() for e in reader: list_1.append(your_func(e)) # your_func為每條數據的處理函數
代碼
# 數據 data = [ {'Petal.Length': '1.4', 'Sepal.Length': '5.1', 'Petal.Width': '0.2', 'Sepal.Width': '3.5', 'Species': 'setosa'}, {'Petal.Length': '1.4', 'Sepal.Length': '4.9', 'Petal.Width': '0.2', 'Sepal.Width': '3', 'Species': 'setosa'}, {'Petal.Length': '1.3', 'Sepal.Length': '4.7', 'Petal.Width': '0.2', 'Sepal.Width': '3.2', 'Species': 'setosa'}, {'Petal.Length': '1.5', 'Sepal.Length': '4.6', 'Petal.Width': '0.2', 'Sepal.Width': '3.1', 'Species': 'setosa'} ] # 表頭 header = ['Petal.Length', 'Sepal.Length', 'Petal.Width', 'Sepal.Width', 'Species'] print len(data) with open('E:/dst.csv', 'wb') as dstfile: #寫入方式選擇wb,否則有空行 writer = csv.DictWriter(dstfile, fieldnames=header) writer.writeheader() # 寫入表頭 writer.writerows(data) # 批量寫入 dstfile.close()
上述代碼將數據整體寫入csv文件,如果數據量較多且想實時查看寫入了多少數據可以使用writerows函數。
代碼
# 讀取csv文件為DataFrame import pandas as pd dframe = pd.DataFrame.from_csv('E:/iris.csv')
也可以稍微曲折點:
import csv import pandas as pd with open('E:/iris.csv') as csvfile: reader = csv.DictReader(csvfile, fieldnames=None) # fieldnames默認為None,如果所讀csv文件沒有表頭,則需要指定 list_1 = [e for e in reader] # 每行數據作為一個dict存入鏈表中 csvfile.close() dfrme = pd.DataFrame.from_records(list_1)
dfrme.to_csv('E:/dst.csv', index=False) # 不要每行的編號
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com