今回の記事はVottでYOLOのアノテーションデータを作る方法をご紹介する内容です。Yoloで自己学習モデルを作成しようと考えている方は是非参考にしてみて下さい。
Vottの使い方
まずはVottをインストールします。下記ページからインストール可能です。
windowsの方はexeファイル、マックの方はdmgファイルをインストールしましょう。
アプリを開くとデータソースの設定をまずは行います。
まずはホーム画面が立ち上がるので左メニューのコンセントマーク(接続)をクリックし、データを接続します。
接続画面の+ボタンを押して接続内容を設定します。
接続設定の表示名は適当な名前を設定、プロバイダーはローカルファイルシステムでアノテーションを行う画像を設定します。
接続が完了すれば新規プロジェクトを立ち上げます。
表示名はプロジェクト名になります。必須項目の設定を行います。ソースは先ほど設定した接続の表示名、ターゲット接続先も同様に同じ表示名に設定します。
あとは画像にひたすらアノテーションをつけていきます。
VottでYOLOのアノテーションデータの作り方
アノテーションを作成した後は出力します。
メニューバーの斜め上矢印の出力ボタンからエクスポート設定を行います。エクスポートの形式はPascal VOC形式で出力します。
アノテーションデータのYOLO formatへの変換
出力されたアノテーションデータはxml形式となっております。このxml形式はYoloの正式なフォーマットではないため変換する必要があります。
変換方法は別記事で詳しく記載しているのでそちらも参考になると思います。
「VottのアノテーションデータをYOLOフォーマットに変換する方法ご紹介。」
まずは、「yolotest」というプロジェクトフォルダを作成し、そこに全てのデータを配置していきます。フォルダ構成は以下のようにして下さい。
yolotest
|--xmls ←xmlファイル
|--images ←アノテーション付けした画像
|--labels ←出力フォルダ
|--classes.txt ←クラス名を全て改行して記載
例)classes.txtの記載
---------
person
dog
apple
---------
次に配置したxmlデータをYOLOフォーマットに変換するためにPythonコードで変換を行います。フルパスの部分と画像の拡張子の部分は修正して下さい。
# ここを修正
## フルパスに修正
parentpath = r"C:〇〇\〇〇\yolotest" # フォルダのパス
## 拡張子によって変更
ext = '.png' # 画像拡張しを記載.jpgなど
#ここはanotetiondataフォルダの構成が変わっている場合個別に設定(基本的に変更なし)
addxmlpath = parentpath + r"\anotetiondata\xmls" # xmlを格納するフォルダパス
addimgpath = parentpath + r"\anotetiondata\images" # 画像を格納するフォルダパス
outputpath = parentpath + r"\anotetiondata\labels" # 出力フォルダパス
classes_txt = parentpath + r"\anotetiondata\classes.txt" # クラス名一覧テキスト
#!/usr/bin/env python
# -*- coding: utf8 -*-
import os
import sys
from xml.etree import ElementTree
from xml.etree.ElementTree import Element, SubElement
from lxml import etree
import codecs
import cv2
from glob import glob
XML_EXT = '.xml'
ENCODE_METHOD = 'utf-8'
class PascalVocReader:
def __init__(self, filepath):
# shapes type:
# [labbel, [(x1,y1), (x2,y2), (x3,y3), (x4,y4)], color, color, difficult]
self.shapes = []
self.filepath = filepath
self.verified = False
try:
self.parseXML()
except:
pass
def getShapes(self):
return self.shapes
def addShape(self, label, bndbox, filename, difficult):
xmin = int(bndbox.find('xmin').text.split('.')[0])
ymin = int(bndbox.find('ymin').text.split('.')[0])
xmax = int(bndbox.find('xmax').text.split('.')[0])
ymax = int(bndbox.find('ymax').text.split('.')[0])
points = [(xmin, ymin), (xmax, ymin), (xmax, ymax), (xmin, ymax)]
self.shapes.append((label, points, filename, difficult))
def parseXML(self):
assert self.filepath.endswith(XML_EXT), "Unsupport file format"
parser = etree.XMLParser(encoding=ENCODE_METHOD)
xmltree = ElementTree.parse(self.filepath, parser=parser).getroot()
filename = xmltree.find('filename').text
path = xmltree.find('path').text
try:
verified = xmltree.attrib['verified']
if verified == 'yes':
self.verified = True
except KeyError:
self.verified = False
for object_iter in xmltree.findall('object'):
bndbox = object_iter.find("bndbox")
label = object_iter.find('name').text
# Add chris
difficult = False
if object_iter.find('difficult') is not None:
difficult = bool(int(object_iter.find('difficult').text))
self.addShape(label, bndbox, path, difficult)
return True
classes = dict()
num_classes = 0
try:
input = raw_input
except NameError:
pass
if os.path.isfile(classes_txt):
with open(classes_txt, "r") as f:
class_list = f.read().strip().split()
classes = {k : v for (v, k) in enumerate(class_list)}
xmlPaths = glob(addxmlpath + "/*.xml")
#imgPaths = glob(addimgpath + "/*"+ext)
for xmlPath in xmlPaths:
tVocParseReader = PascalVocReader(xmlPath)
shapes = tVocParseReader.getShapes()
with open(outputpath + "/" + os.path.basename(xmlPath)[:-4] + ".txt", "w") as f:
for shape in shapes:
class_name = shape[0]
box = shape[1]
#filename = os.path.splittext(xmlPath)[0] + ext
filename = os.path.splitext(addimgpath + "\\" + os.path.basename(xmlPath)[:-4])[0] + ext
if class_name not in classes.keys():
classes[class_name] = num_classes
num_classes += 1
class_idx = classes[class_name]
(height, width, _) = cv2.imread(filename).shape
coord_min = box[0]
coord_max = box[2]
xcen = float((coord_min[0] + coord_max[0])) / 2 / width
ycen = float((coord_min[1] + coord_max[1])) / 2 / height
w = float((coord_max[0] - coord_min[0])) / width
h = float((coord_max[1] - coord_min[1])) / height
f.write("%d %.06f %.06f %.06f %.06f\n" % (class_idx, xcen, ycen, w, h))
#print(class_idx, xcen, ycen, w, h)
with open(parentpath + "classes.txt", "w") as f:
for key in classes.keys():
f.write("%s\n" % key)
#print(key)
これでlabelsに出力されたファイルをYOLOのオリジナル学習に使用できます。
以上でVottで作成したアノテーションデータをYOLOのオリジナル学習に利用できるようになりました。
では今回の記事は以上です。
YOLOをPythonで動かしてオリジナル画像で学習させる方法に関しては別記事を記載しているのでそちらの記事を参考にしてみて下さい。
コメント