善用CSV - 介紹
01-30
為什麼介紹CSV 呢,如果你要開始使用資料庫,需要從安裝資料庫開始,需要了解SQL,是不是已經有點卻步了,沒關係我們從CSV 格式開始。
你認識的CSV可能就是Excel 的一種格式,但是它的作用遠不僅於此。
逗號分隔值(Comma-Separated Values,CSV,有時也稱為字元分隔值,因為分隔字元也可以不是逗號),其文件以純文本形式存儲表格數據(數字和文本)。
CSV文件格式的通用標準並不存在,但是在RFC 4180中有基礎性的描述。
CSV是一種通用的、相對簡單的文件格式,被用戶、商業和科學廣泛應用。最廣泛的應用是在程序之間轉移表格數據,而這些程序本身是在不兼容的格式上進行操作的(往往是私有的和/或無規範的格式)。因為大量程序都支持某種CSV變體,至少是作為一種可選擇的輸入/輸出格式。
例如,一個用戶可能需要交換信息,從一個以私有格式存儲數據的資料庫程序,到一個數據格式完全不同的電子表格。最可能的情況是,該資料庫程序可以導出數據為「CSV」,然後被導出的CSV文件可以被電子表格程序導入。
從這裡可以看出它和資料庫其實是很緊密的。但是它又不是資料庫,有它自己的特色:
- 純文本,使用某個字符集,比如ASCII、Unicode、EBCDIC或GB2312(簡體中文環境)等;
- 由記錄組成(典型的是每行一條記錄); 每條記錄被分隔符分隔為欄位(典型分隔符有逗號、分號或製表符;有時分隔符可以包括可選的空格);
- 每條記錄都有同樣的欄位序列。
CSV格式最好被用來表現記錄集合或序列,其中的每條記錄都有完全相同的欄位序列。這相當於關係資料庫中一個單一的關係,或者典型的電子表格中的數據(雖然不能計算)。
它的局限在於,資料庫可以包含多張類似於表的結構,但是csv 一個文件僅能表示一張表,多個表需要多個文件來表示。當然作為中間交換數據,這已經夠了。
推薦閱讀: