今回の記事はPythonを利用して日本語文字をローマ字に変換する方法についてご紹介します。RPA関連の記事を探している方がこの記事にたどり着いたと思いますのでそんな方はPython利用したRPAのよう業務効率化関連の記事を他にも記載しているのでそちらもご参照ください。
日本語をローマ字に変換するPythonライブラリと開発環境
今回使用するライブラリが下記です。世の中にはたくさん便利なものを開発している方がいるなと感じました。
まずは今回の開発環境ご紹介します。私の今回の環境自体はDocker上に構築しておりますがローカルPC上にPythonをインストールしても特に違いはないです。また、私のPCはMacですが、Windowsでも同じような操作で問題なく操作できます。
Mac:10.15.6
Docker:19.03.12
Python:3.6.5
Docker上にPython環境をDockerfileにて構築する方法については下記をご参照ください。
「Docker上でAnaconda(Python)の環境を構築する方法。」
では今回の本題の日本語をローマ字に変換してくれる便利なライブラリですが、「pykakasi」という名前です。こちらを「pip install」でインストールしてください。
pip install pykakasi
これで「pykakasi」が使用できるようになっているので実際にPythonコードを使用して日本語をローマ時に変換していきます。
日本語をローマ字に変換するPythonコード
下記コードを実行します。
from pykakasi import kakasi
kakasi = kakasi()
kakasi.setMode('H', 'a')
kakasi.setMode('K', 'a')
kakasi.setMode('J', 'a')
conv = kakasi.getConverter()
word = 'あいうえお漢字'
print(conv.do(word))
下記が実行結果です。
python convert.py
'aiueokanji'
どうやら「じ」が「zi」ではなく「ji」で訳されるようです。以上が今回の記事の内容になります。地味な業務の作業効率UPやRPA関連は大好きなので他にもいくつか記事を書いております。是非参考にしてみてください。」
コメント