概要とサンプルコード
Pythonでは、正規表現を使うことで、文字列をマッチングしたり、置換したりすることができます。
正規表現を使うには、reモジュールをインポートする必要があります。
reモジュールには、様々な関数が用意されていますが、基本的な使い方は、次のようになります。
re.compile()関数を使って、正規表現パターンをコンパイルする
マッチングを行うための関数を呼び出す
例えば、次のようにして、文字列から数字のみを抽出することができます。
import re # 正規表現パターンをコンパイルする pattern = re.compile(r'\d+') # 文字列をマッチングする result = pattern.findall('123abc456def') print(result) # ['123', '456']
上のコードでは、re.compile()関数を使って、正規表現パターンをコンパイルしています。
このとき、r”という形式の文字列を使うことで、バックスラッシュをエスケープする必要がなくなります。
次に、findall()メソッドを使って、文字列をマッチングしています。findall()メソッドは、正規表現にマッチする文字列をすべて抽出するものです。
正規表現について、詳しく知りたい場合は、正規表現のドキュメントや、書籍を参照すると良いでしょう。
また、Pythonでは、正規表現以外にも、文字列をマッチングする方法として、startswith()やendswith()、find()、index()などのメソッドがあります。
これらのメソッドは、文字列操作でよく使われるものですので、覚えておくと便利です。
コメント