對於監督學習算法而言,數據決定了任務的上限,而算法只是在不斷逼近這個上限。世界上最遙遠的距離就是我們用同一個模型,但是卻有不同的任務。但是數據標注是個耗時耗力的工作,下面介紹幾個圖像標注工具:
Labelme
Labelme適用於圖像分割任務的數據集制作:
它來自下面的項目:https://github.com/wkentaro/labelme
該軟件實現了最基本的分割數據標注工作,在save后將保持Object的一些信息到一個json文件中,如下:
https://github.com/wkentaro/labelme/blob/master/static/apc2016_obj3.json
同時該軟件提供了將json文件轉化為labelimage的功能:
labelImg
Labelme適用於圖像檢測任務的數據集制作:
它來自下面的項目:https://github.com/tzutalin/labelImg
其中標簽存儲功能和“Next Image”、“Prev Image”的設計使用起來比較方便。
該軟件最后保存的xml文件格式和ImageNet數據集是一樣的。
yolo_mark
yolo_mark適用於圖像檢測任務的數據集制作:
它來自於下面的項目:https://github.com/AlexeyAB/Yolo_mark
它是yolo2的團隊開源的一個圖像標注工具,為了方便其他人使用yolo2訓練自己的任務模型。在linux和win下都可運行,依賴opencv庫。
Vatic
Vatic適用於圖像檢測任務的數據集制作:
它來自下面的項目:http://carlvondrick.com/vatic/
比較特別的是,它可以做視頻的標注,比如一個25fps的視頻,只需要隔100幀左右手動標注一下物體的位置,最后在整個視頻中就能有比較好的效果。這依賴於軟件集成的opencv的追蹤算法。
Sloth
Sloth適用於圖像檢測任務的數據集制作:
它來自下面的項目:
https://github.com/cvhciKIT/sloth
https://cvhci.anthropomatik.kit.edu/~baeuml/projects/a-universal-labeling-tool-for-computer-vision-sloth/
在標注label的時候,該軟件可以存儲標簽,並呈現標注過的圖片中的bbox列表。
Annotorious
Annotorious適用於圖像檢測任務的數據集制作:
它來自下面的項目:
http://annotorious.github.io/index.html
代碼寫的相當規范,提供了相應的API接口,方便直接修改和調用。
RectLabel
RectLabel適用於圖像檢測任務的數據集制作:
它來自下面的項目:
https://rectlabel.com/
這是一個適用於Mac OS X的軟件,而且可以在apple app store中直接下載。
VoTT
VoTT適用於圖像檢測任務的數據集制作:
它來自下面的項目:
https://github.com/Microsoft/VoTT/
微軟的開源工具,既可以標注視頻,也可以標注圖片,而且支持已有模型的集成,功能強大。
IAT – Image Annotation Tool
IAT適用於圖像分割任務的數據集制作:
它來自下面的項目:
http://www.ivl.disco.unimib.it/activities/imgann/
比較有特色的是,它支持一些基礎形狀的選擇,比如要分割的物體是個圓形的,那么分割時可以直接選擇圓形,而不是用多邊形選點。
images_annotation_programme
images_annotation_programme適用於圖像檢測任務的數據集制作:
它來自下面的項目:
https://github.com/frederictost/images_annotation_programme