計算機視覺中的圖像標注工具總結


 本文來自公眾號CV技術指南資源分享系列

創建高質量的數據集是任何機器學習項目的關鍵部分。在實踐中,這通常比實際訓練和超參數優化花費的時間更長。因此,選擇合適的標注工具至關重要。在這里,我們總結了一些用於計算機視覺任務的最佳圖像標注工具:labelme、labelImg、CVAT和hasty.ai。

 

作者:Dmitrii

編譯:CV技術指南

歡迎關注公眾號CV技術指南,專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀

 

labelme

地址:https://github.com/wkentaro/labelme

你可以用它做什么

labelme 是一個基於 python 的開源圖像多邊形標注工具,可用於手動標注圖像以進行對象檢測、分割和分類。它是在線 LabelMe 的離線分支,最近關閉了新用戶注冊選項。所以,在這篇文章中,我們只考慮 labelme(小寫)。

該工具是具有直觀用戶界面的輕量級圖形應用程序。使用 labelme,您可以創建:多邊形、矩形、圓、線、點或線帶。

通常,能夠以眾所周知的格式(例如 COCO、YOLO 或 PASCAL VOL)導出注釋以供后續使用通常很方便。但是,在 labelme 中,標簽只能直接從應用程序保存為 JSON 文件。如果要使用其他格式,可以使用 labelme 存儲庫中的 Python 腳本將注釋轉換為 PASCAL VOL。

盡管如此,它還是一個相當可靠的應用程序,具有用於手動圖像標記和廣泛的計算機視覺任務的簡單功能。

 

安裝和配置

labelme 是一個跨平台的應用程序,可以在多個系統上工作,例如 Windows、Ubuntu 或 macOS。安裝本身非常簡單,這里有很好的描述。例如,在 macOS 上,您需要在終端中運行以下命令:

  1. 安裝依賴:brew install pyqt

  2. 安裝labelme:pip install labelme

  3. 運行 labelme:labelme

 

labelImg

地址:https://github.com/tzutalin/labelImg

你可以用它做什么

labelImg 是一種廣泛使用的開源圖形注釋工具。它僅適用於目標定位或檢測任務,並且只能在考慮的對象周圍創建矩形框。

盡管存在這種限制,我們還是建議使用此工具,因為該應用程序僅專注於創建盡可能簡化工具的邊界框。對於此任務,labelImg 具有所有必要的功能和方便的鍵盤快捷鍵。

另一個優點是您可以以 3 種流行的注釋格式保存/加載注釋:PASCAL VOC、YOLO 和 CreateML。

 

安裝和配置

這里對安裝進行了很好的描述。還要注意 labelImg 是一個跨平台的應用程序。例如,對於 MacOS,需要在命令行上執行以下操作:

  1. 安裝依賴:先 brew install qt,然后 brew install libxml2

  2. 選擇要安裝的文件夾的位置。

  3. 當你在文件夾中時,運行以下命令:git clone https://github.com/tzutalin/labelImg.git, cd labelImg 然后 make qt5py3

  4. 運行 labelImg:python3 labelImg.py

  5. 開發人員強烈建議使用 Python 3 或更高版本和 PyQt5。

 

 

CVAT

地址:https://github.com/openvinotoolkit/cvat

你可以用它做什么

CVAT 是一種用於圖像和視頻的開源注釋工具,用於對象檢測、分割和分類等任務。

要使用此工具,您無需在計算機上安裝該應用程序。可以在線使用此工具的網絡版本。您可以作為一個團隊協作處理標記圖像並在用戶之間分配工作。

還有一個很好的選擇,它允許您使用預先訓練的模型來自動標記您的數據,如果您使用 CVAT 儀表板中現有的可用模型,這可以簡化最流行的類(例如,COCO 中包含的類)的過程。或者,您也可以使用自己的預訓練模型。

CVAT 具有我們已經考慮過的工具中最廣泛的功能集。特別是,它允許您以大約 15 種不同的格式保存標簽。可以在此處找到完整的格式列表。

 

 

hasty.ai

地址:https://hasty.ai/

你可以用它做什么

與上述所有工具不同,hasty.ai 不是免費的開源服務,但由於所謂的對象檢測和分割的 AI 助手,它非常方便地標記數據。自動支持允許您顯着加快注釋過程,因為在標記期間輔助模型正在訓練。換句話說,標記的圖像越多,助手的工作就越准確。我們將在下面看一個例子來說明它是如何工作的。您也可以免費試用此服務。該試驗提供 3000 積分,足以為一個物體檢測任務自動生成大約 3000 個物體的建議標簽。hasty.ai 允許您以 COCO 或 Pascal VOC 格式導出數據。您還可以作為一個團隊處理單個項目並在項目設置中分配角色。免費積分用完后,hasty.ai 仍然可以免費使用,但標記將完全由手動操作。在這種情況下,最好考慮上述免費工具。

配置

  1. 要使用該工具,您需要在 hasty.ai 上注冊。

  2. 登錄您的帳戶。

  3. 單擊創建新項目。

  4. 用名稱和描述填寫表單並導航到項目設置,您可以在其中定義考慮中的類,為該項目添加數據。

  5. 此外,您可以添加其他用戶來共同處理項目。積分將從共享項目的用戶的帳戶中使用。

 

原文地址:https://medium.com/dida-machine-learning/the-best-labeling-tools-for-computer-vision-bf4a9642f796

 

歡迎關注公眾號 CV技術指南 ,專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀。

在公眾號中回復關鍵字 “技術總結”可獲取公眾號原創技術總結文章的匯總pdf。

其它文章

CV技術指南--精華文章匯總分類

神經網絡超參數的調參方法總結

輕量化模型系列--GhostNet:廉價操作生成更多特征

ICCV2021 | MicroNet:以極低的 FLOPs 改進圖像識別

CVPR2021 | 重新思考BatchNorm中的Batch

ICCV2021 | 重新思考視覺transformers的空間維度

CVPR2021 | Transformer用於End-to-End視頻實例分割

ICCV2021 |(騰訊優圖)重新思考人群中的計數和定位:一個純粹基於點的框架

卷積神經網絡的復雜度分析

2021年小目標檢測最新研究綜述

計算機視覺中的自注意力

綜述專欄 | 姿態估計綜述

漫談CUDA優化

為什么GEMM是深度學習的核心

使用深度神經網絡為什么8位足夠?

經典論文系列--膠囊網絡:新的深度學習網絡

經典論文系列 | 目標檢測--CornerNet & 又名 anchor boxes的缺陷

如何看待人工智能的泡沫

使用Dice loss實現清晰的邊界檢測

PVT--無卷積密集預測的多功能backbone

CVPR2021 | 開放世界的目標檢測

Siamese network總結

視覺目標檢測和識別之過去,現在及可能

在做算法工程師的道路上,你掌握了什么概念或技術使你感覺自我提升突飛猛進?

計算機視覺專業術語總結(一)構建計算機視覺的知識體系

欠擬合與過擬合技術總結

歸一化方法總結

論文創新的常見思路總結

CV方向的高效閱讀英文文獻方法總結

計算機視覺中的小樣本學習綜述   

知識蒸餾的簡要概述    

計算機視覺中的特征金字塔技術總結

Siamese network總結

計算機視覺中的注意力機制技術總結

文字識別OCR開源框架的對比--Tesseract vs EasyOCR

計算機視覺專業術語總結(一)構建計算機視覺的知識體系

北京大學施柏鑫:從審稿人視角,談談怎么寫一篇CVPR論文

歸一化方法總結

計算機視覺的高效閱讀英文文獻方法總結

計算機視覺中的小樣本學習綜述

知識蒸餾的簡要概述

損失函數技術總結

CVPR2021 | 開放世界的目標檢測

CVPR2021|PVT--無卷積密集預測的多功能backbone

CVPR2021|特征金字塔的新方式YOLOF

CVPR2021 | 華為諾亞實驗室提出Transformer in Transformer

CVPR2021| 繼SE,CBAM后的一種新的注意力機制Coordinate Attention

經典論文系列 | 重新思考在ImageNet上的預訓練


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM