正規表現でひらがなやカタカナを使う方法について紹介する記事です。
具体的には以下の3つの方法について紹介します。
・正規表現でひらがなを使う方法
・正規表現をカタカナを使う方法
・半角カタカナを使う方法
・Pythonでの記述例
本記事を読めば正規表現でひらがなやカタカナを使う方法について理解できます。
正規表現チェッカー>>正規表現チェッカー for Python
目次
正規表現でひらがなを使う方法
正規表現でひらがなを使う場合には、[]の中に記述します。
ハイフンを使って範囲指定することが可能です。
記述例は以下の通り。
全てのひらがなを使いたい場合は「[あ-ん]」のように範囲指定します。
「[あいうえお]」と指定した場合、「あいうえお」という単語にマッチするのではなく「あ」から「お」の全ての文字にマッチします。
「あいうえお」という単語にマッチさせたい場合は[]を使わずにそのまま記述すればOKです。
正規表現を全角カタカナを使う方法
正規表現で全角カタカナを使う場合はひらがなと同様に[]の中に記述します。
ハイフンを使って範囲指定することが可能です。
記述例は以下の通り。
全てのカタカナを使いたい場合は「[ア-ン]」のように範囲指定します。
「[アイウエオ]」と指定した場合、「アイウエオ」という単語にマッチするのではなく「ア」から「オ」の全ての文字にマッチします。
ひらがなの場合と同様で「アイウエオ」という単語にマッチさせたい場合は[]を使わずにそのまま記述すればOKです。
正規表現を半角カタカナを使う方法
正規表現で全角カタカナと半角カタカナは別の文字として扱われます。
半角カタカナを使いたい場合は別途記述が必要です。
全てのカタカナを使いたい場合は「[ア-ン]」のように範囲指定します。
「[アイウエオ]」と指定した場合、「アイウエオ」という単語にマッチするのではなく「ア」から「オ」の全ての文字にマッチします。
ひらがなの場合と同様で「アイウエオ」という単語にマッチさせたい場合は[]を使わずにそのまま記述すればOKです。
全角カタカナと半角カタカナ両方使いたい場合は以下のように記述します。
Pythonで記述例
Pythonでの記述例について紹介します。
◆ひらがなをマッチさせる例
1 2 3 | import re pattern = re.compile('[あ-ん]+') pattern.match('こんにちは') |
1 | <re.Match object; span=(0, 5), match='こんにちは'> |
◆全角カタカナをマッチさせる例
1 2 3 | import re pattern = re.compile('[ア-ン]+') pattern.match('コンニチハ') |
1 | <re.Match object; span=(0, 5), match='コンニチハ'> |
◆半角カタカナをマッチさせる例
1 2 3 4 | import re pattern = re.compile('[ア-ン]+') pattern.match('コンニチハ') <re.Match object; span=(0, 5), match='コンニチハ'> |
◆ひらがなカタカナ両方をマッチさせる例
以下のように記述することでひらがな・半角全角カタカナ全てにマッチさせることができます。
1 2 3 4 5 | import re pattern = re.compile('[あ-んア-ンア-ン]+') pattern.match('こんにちは') pattern.match('コンニチハ') pattern.match('コンニチハ') |
1 2 3 | <re.Match object; span=(0, 5), match='こんにちは'> <re.Match object; span=(0, 5), match='コンニチハ'> <re.Match object; span=(0, 5), match='コンニチハ'> |
終わりに
ひらがなとカタカナの正規表現マッチ例を紹介しました。
基本的に「[]」の間に記述すればOKです。
正規表現は複雑に見えますが、規則を理解すれば難しくありません。
一つずつパターンを学んでいきましょう。
関連記事>>正規表現で英数字を使う方法
正規表現の基本>>Python正規表現の特殊記号と記述方法まとめ
正規表現チェッカー>>正規表現チェッカー for Python
おすすめ記事>>PythonにおすすめのノートPC4選+パソコンの選び方