csvモジュールの基本
Python標準ライブラリのcsv
モジュールは、CSVファイルの読み書きを簡単に行うことができます。
import csv
with open('example.csv', newline='') as csvfile:
reader = csv.reader(csvfile)
for row in reader:
print(row)
このコードはCSVファイルを開き、各行をリストとして読み込んで出力します。
カスタムデリミタと引用符
CSVファイルのデリミタ(区切り文字)や引用符が標準のカンマやダブルクォートではない場合は、csv.reader
にパラメータを渡すことができます。
with open('example.tsv', newline='') as csvfile:
reader = csv.reader(csvfile, delimiter='\t', quotechar='|')
for row in reader:
print(row)
辞書としてCSVを読み込む
csv.DictReader
を使用すると、CSVの各行を辞書として読み込むことができ、列のヘッダーをキーとして値にアクセスできます。
with open('example.csv', newline='') as csvfile:
reader = csv.DictReader(csvfile)
for row in reader:
print(row['header_name'])
pandasを使ったCSVの読み込み
pandasライブラリを使用すると、大規模なデータセットの操作が容易になります。
import pandas as pd
df = pd.read_csv('example.csv')
print(df)
pandasはCSVのデータをDataFrameオブジェクトとして読み込みます。
エンコーディングの指定
CSVファイルの文字コードがUTF-8以外の場合は、encoding
パラメータで指定する必要があります。
with open('example.csv', encoding='utf-16') as csvfile:
reader = csv.reader(csvfile)
for row in reader:
print(row)
エラーハンドリング
ファイルが存在しない、または読み込み中にエラーが発生した場合の処理も重要です。
try:
with open('example.csv', newline='') as csvfile:
reader = csv.reader(csvfile)
for row in reader:
print(row)
except FileNotFoundError:
print("ファイルが見つかりませんでした。")
except csv.Error as e:
print("CSV読み込み中にエラーが発生しました。:", e)
まとめ
PythonでCSVファイルを読み込む方法は多様で、用途に応じて標準のcsv
モジュールやpandasなどのライブラリを選択できます。この記事がPythonでのCSVファイル操作の参考になることを願っています。
コメント