スポンサーリンク

【YOLO】Vott出力のxmlデータをYOLOフォーマットのlabelsに変換する方法ご紹介。

YOLO
スポンサーリンク

今回の記事はVottで出力したPascal VOC形式のxmlファイルをYOLOフォーマットのlabelsに変換する方法をご紹介する内容です。オリジナル画像でYOLOのモデル学習を行っている人は是非参考にしてみて下さい。

スポンサーリンク

Pythonの必要モジュールをインストール

pip install lxml opencv-python

YOLOのアノテーションデータを配置

yolotestというプロジェクトフォルダを作成し、そこに全てのデータを配置していきます。フォルダ構成は以下のようにして下さい。

yolotest
  |--xmls  ←xmlファイル
  |--images  ←アノテーション付けした画像
  |--labels  ←出力フォルダ
  |--classes.txt  ←クラス名を全て改行して記載

例)classes.txtの記載
---------
person
dog
apple
---------

xmlデータをYOLOフォーマットに変換

フルパスの部分と画像の拡張子の部分は修正して下さい。

# ここを修正
## フルパスに修正
parentpath = r"C:〇〇\〇〇\yolotest" # フォルダのパス
## 拡張子によって変更
ext = '.png' # 画像拡張しを記載.jpgなど

#ここはanotetiondataフォルダの構成が変わっている場合個別に設定(基本的に変更なし)
addxmlpath = parentpath + r"\anotetiondata\xmls" # xmlを格納するフォルダパス
addimgpath = parentpath + r"\anotetiondata\images" # 画像を格納するフォルダパス
outputpath = parentpath + r"\anotetiondata\labels" # 出力フォルダパス
classes_txt = parentpath + r"\anotetiondata\classes.txt" # クラス名一覧テキスト

#!/usr/bin/env python
# -*- coding: utf8 -*-
import os
import sys
from xml.etree import ElementTree
from xml.etree.ElementTree import Element, SubElement
from lxml import etree
import codecs
import cv2
from glob import glob

XML_EXT = '.xml'
ENCODE_METHOD = 'utf-8'

class PascalVocReader:
    def __init__(self, filepath):
        # shapes type:
        # [labbel, [(x1,y1), (x2,y2), (x3,y3), (x4,y4)], color, color, difficult]
        self.shapes = []
        self.filepath = filepath
        self.verified = False
        try:
            self.parseXML()
        except:
            pass

    def getShapes(self):
        return self.shapes

    def addShape(self, label, bndbox, filename, difficult):
        xmin = int(bndbox.find('xmin').text.split('.')[0])
        ymin = int(bndbox.find('ymin').text.split('.')[0])
        xmax = int(bndbox.find('xmax').text.split('.')[0])
        ymax = int(bndbox.find('ymax').text.split('.')[0])
        points = [(xmin, ymin), (xmax, ymin), (xmax, ymax), (xmin, ymax)]
        self.shapes.append((label, points, filename, difficult))

    def parseXML(self):
        assert self.filepath.endswith(XML_EXT), "Unsupport file format"
        parser = etree.XMLParser(encoding=ENCODE_METHOD)
        xmltree = ElementTree.parse(self.filepath, parser=parser).getroot()
        filename = xmltree.find('filename').text
        path = xmltree.find('path').text
        
        try:
            verified = xmltree.attrib['verified']
            if verified == 'yes':
                self.verified = True
        except KeyError:
            self.verified = False

        for object_iter in xmltree.findall('object'):
            
            bndbox = object_iter.find("bndbox")
            label = object_iter.find('name').text

            # Add chris

            difficult = False
            if object_iter.find('difficult') is not None:
                difficult = bool(int(object_iter.find('difficult').text))
            self.addShape(label, bndbox, path, difficult)
        return True


classes = dict()
num_classes = 0

try:
    input = raw_input
except NameError:
    pass

if os.path.isfile(classes_txt):
    with open(classes_txt, "r") as f:
        class_list = f.read().strip().split()
        classes = {k : v for (v, k) in enumerate(class_list)}

xmlPaths = glob(addxmlpath + "/*.xml")
#imgPaths = glob(addimgpath + "/*"+ext)

for xmlPath in xmlPaths:
    tVocParseReader = PascalVocReader(xmlPath)
    shapes = tVocParseReader.getShapes()
   
    with open(outputpath + "/" + os.path.basename(xmlPath)[:-4] + ".txt", "w") as f:
        
        for shape in shapes:
            class_name = shape[0]
            box = shape[1]
            #filename = os.path.splittext(xmlPath)[0] + ext
            filename = os.path.splitext(addimgpath + "\\" + os.path.basename(xmlPath)[:-4])[0] + ext

            if class_name not in classes.keys():
                classes[class_name] = num_classes
                num_classes += 1
            class_idx = classes[class_name]

            (height, width, _) = cv2.imread(filename).shape

            coord_min = box[0]
            coord_max = box[2]

            xcen = float((coord_min[0] + coord_max[0])) / 2 / width
            ycen = float((coord_min[1] + coord_max[1])) / 2 / height
            w = float((coord_max[0] - coord_min[0])) / width
            h = float((coord_max[1] - coord_min[1])) / height

            f.write("%d %.06f %.06f %.06f %.06f\n" % (class_idx, xcen, ycen, w, h))
            #print(class_idx, xcen, ycen, w, h)

with open(parentpath + "classes.txt", "w") as f:
    for key in classes.keys():
        f.write("%s\n" % key)
        #print(key)

これでlabelsに出力されたファイルをYOLOのオリジナル学習に使用します。

YOLOでオリジナル画像を学習する手順は別記事に記載しているので是非そちらを参考にしてみて下さい。

では今回の記事は以上です。他にも多数の機械学習関連記事を記載していまのでサイト内みて行って下さい。

スポンサーリンク
スポンサーリンク
スポンサーリンク

ブログに関しては500円程度かかりますが、それ以外は無料です。知識の吸収と並行してアウトプットは非常に効率が良いです。テックアカデミーに関しては講座レベルが高いにも関わらず、無料体験や人気口座も大幅値下げがあるので、重点的に学びたいものを無料体験してみてください。

転職時にも、エンジニアからテックアカデミー・Paizaは認知度が高いので、未経験入社採用を行う際履歴書で目に留まります。特にPaizaのスキルレベルA・SなどはIT業界でも評価されます。

テックアカデミー・Paizaの無料登録ができる期間中にぜひご利用してみてください。私も活用経験ありです。

YOLO
スポンサーリンク
スポンサーリンク

コメント

タイトルとURLをコピーしました