CSVファイルとは

CSVファイルとはカンマ区切りのテキストファイルのことで、 CSVはComma Separated Valueの略称です。

  • Comma(カンマで)
  • Separated(区切られている)
  • Value(値)

CSVファイルはシンプルなテキストファイルなので汎用性が高く、 アプリケーション間やシステム間でのデータ移行の際に 利用することも多々あります。
CSVファイルの拡張子は「.csv」です。

ここではCSVファイルの特徴や、 よく比較されるExcelファイルなどとの違いについて説明します。

CSVファイルの特徴

カンマ区切りのテキストファイル

CSVファイルは次のようにデータがカンマ(,)で区切られているテキストファイルです。

1,田中,東京,29
2,鈴木,大阪,35
3,佐藤,鹿児島,28
4,五十嵐,北海道,38
5,川島,福岡,32

ファイルのサイズが小さくて済む

CSVファイルはデータとカンマだけのテキストファイルで、 それ以外の情報は含まれません。 余計な情報が含まれていない分ファイルのサイズも小さくて済みます。

一方Excelファイルなどではデータだけでなくフォントの大きさ、色などの装飾情報も含まれ、 グラフなどを作成した場合は、それらの情報も含まれてきます。 その分ファイルのサイズも大きくなります。

ちょっとした量のデータではそれほど違いはありませんが、 データ量が多くなればなるほどファイルのサイズに差が出てきます。

様々なアプリケーションで活用できる

メモ帳のようなテキストエディタを始めとして、 Excelなどの表計算ソフト、Accessなどのデータベースソフトといった 様々なアプリケーションでCSVファイルを活用できます。

データの抽出や取り込みが簡単

CSVファイルを使うことで、 アプリケーションやシステムのデータの抽出(エクスポート)や取り込み(インポート)が 容易になります。

下図のようにアプリデータをCSVファイルとして抽出することをエクスポートと言い、 CSVファイルからアプリデータを取り込むことをインポートといいます。

インポート・エクスポート

このようにCSVファイルを介することで、 異なるアプリや別PCのアプリとのデータのやり取りが容易になります。

CSVファイルと他のファイルとの違い

ここではCSVファイルとよく比較される 他のファイル形式との違いについて説明します。

Excelファイルとの違い

excel

CSVファイルとExcelファイルの違いを挙げると、まずファイルの拡張子が違います。 CSVファイルの拡張子は「.csv」でExcelファイルの拡張子は「.xlsx」や「.xls」です。

Excelファイルはマイクロソフト社のExcelで使うことを前提としたデータファイルです。 使用できるアプリケーションは限定されますが、 データをもとにグラフを表示したり、装飾をほどこしたり様々な機能が利用できます。

CSVファイルは特定のソフトに限定されないテキストデータで、 さまざまなアプリケーションで利用できます。 その一方でエクセルのようにグラフを表示したり装飾をほどこしたりはできません。

どちらの形式にも長所・短所があり、 「汎用性で選ぶならCSVファイル、機能性で選ぶならExcelファイル」と言えます。

TSVファイルとの違い

CSVファイルと似た形式のファイルでTSV(Tab Separated Value)ファイルがあります。

TSVファイルは名前の通り、値がタブで区切られたテキスト形式のファイルです。
CSVファイルとの違いは区切り文字がカンマかタブかの違いとなります。

例えば、次のようなカンマ区切りのデータがあるとします。

CSV

同じデータをTAB区切りで表示すると次のようになります。
(エディタの設定によって見た目は違ってきます)

TSV

どちらも互換性の高いテキストファイルなので、 CSVファイルの特徴がほぼそのままTSVファイルの特徴となります。 一般的にはCSVファイルの方が浸透していますが、 CSVよりもTSVファイルを好んで使う方も多数います。

総称としてのCSV(Character Separated Value)との違い

カンマ区切りのCSV(Comma Separated Value)や、 タブ区切りのTSV(Tab Separated Value)の他にも、 スペース区切りのSSV(Space Sparated Value)など 任意の1文字で区切る形式を総称してCSV (Character Separated Value)と呼ぶ場合もあります(下図参照)。

CSVファイル

一般的にはCSVと言えばカンマ区切りのファイルを意味しますが、 人によっては任意の文字で区切っているファイル (Character Separated Value)の意味で使う人もいます。

どちらの意味で使っているかは前後の文脈から判断できることがほとんどです。 ですが業務で使用する場合は「カンマ区切り」「タブ区切り」などの「〇〇区切り」という 確認をちゃんとしておくことが大事です。