今回の記事はTensorFlowの「Object Detection API」で自作の物体検出(文字領域検出など)を行う手順やその際に必要なアノテーションツール(VoTT)のご紹介を行う方法に関してご紹介します。物体検出を自作のモデルで行って見たい方などは是非見て下さい。
「Object Detection API」で自作の物体検出を行う手順
流れとしては下記のようになります。
①物体検出したい対象の画像を集める
②画像にアノテーションをつける
③アノテーションデータをtensorflowの教師データ形式(tflite)に変換
④モデル学習
簡単に書いておりますが、結構時間はかかります。
ではその際使用する環境のご紹介をします。
「Object Detection API」の環境
環境はDockerで行ったほうが無難かと思います。PCの環境に左右されないのが理由です。下記記事を参考にして下さい。
「「Object Detection API」をDockerに環境構築し、「jupyter notebook」で実行する方法。」
VScodeでDockerコンテナを操作する方法もあり非常に便利ですので下記など興味あればご参照ください。
もちろんdockerを使用しない方はローカルに同じように環境を作っていってください。ただし、かなり現状のPCの環境に依存するのでその辺り注意が必要です。
環境構成ができた段階でdocker の/models/research/のフォルダにもう一つ必要になってくるレポジトリがあるのでそちらをgitでcloneします。
cd models/research
git clone https://github.com/karaage0703/object_detection_tools
では次にアノテーションツールに関してご紹介します。
「Object Detection API」おすすめアノテーションツール
アノテーションツールは「VoTT」です。
使用方法も非常に簡単です。使用方法を簡単に解説した内容を下記にまとめているので是非参考にして見てください。
「VoTTの簡単な使い方ご紹介。」
「VoTTのアノテーションの自動化ご紹介。」
では今回の記事は以上です。他にも多数の機械学習関連の記事を記載しているので是非そちらも興味があれば参考にして見て下さい。
コメント
[…] […]
[…] 【Python】pythonのtensorflowで文字検知と文字認識①(環境構築と必要モジュー… […]