制作自己的數據集用於faster-rcnn訓練


主要參考下面這個博客:

http://blog.csdn.net/sinat_30071459/article/details/50723212

1、首先對圖片按照VOC2007里面圖片的格式進行重命名

function imgName( )
path = 'C:\Users\lenovo\Desktop\racket_dect\paizi\';%所有圖片存放的路徑
D = dir([path '*.jpg']);%將該路徑下的所有文件讀取成一個結構體
for i = 1:length(D)%遍歷每一張圖片
     image_name = D(i).name;%每一張圖片的名字
     I = imread(strcat(path,image_name));%讀取每一張圖片
     nz	= strcat('%0',num2str(6),'d');%給該圖片重命名名字的位數
     temp_id = sprintf(nz,i);%按序數給所有圖片命名,前面補0
     name2 = strcat(temp_id,'.jpg');
     imwrite(I,name2);%以新名字保存圖片
end
end

2、用腳本程序對圖片進行標注

注意在腳本程序標注的過程中,按一下m再按n,這樣才能成功將你標注的矩形框坐標保存在output.txt中

利用腳本程序把所有圖片標注完了后,首先用下面這個程序對生成的output.txt文件中的內容進行一些修改

clc
clear all
close all

fidin1=fopen('C:\Users\lenovo\Desktop\racket_dect\paizi\output.txt','r+');% 需要讀取的文件
i=0;
while ~feof(fidin1)
    tline=fgetl(fidin1);%讀取一行
    i=i+1;
    %fprintf(fidout,'%s\n',tline);       
    newtline{i}=tline;     
    newtline{i}=strrep(tline,'m','person');%替換的函數

end
fclose(fidin1);
%%重新以寫的形式打開,寫入覆蓋原來的內容
fidin1=fopen('C:\Users\lenovo\Desktop\racket_dect\拍子\output.txt','w+');
for j=1:1:i
    fprintf(fidin1,'%s\r\n',newtline{j});
end
fclose(fidin1);
end

 

接下來是新建兩個文件夾:

新建文件夾Annotations,將之后生成的XML文件全部放到該文件夾里。
新建文件夾ImageSets,並在ImageSets里再新建文件夾,命名為Main。 我們可以通過xml名字(或圖片名),生成四個txt文件,保存在Main中。
 

3、利用下面這段代碼將這個output文件轉化成XML文件,每張圖對應一個XML文件  

%%
%該代碼可以做voc2007數據集中的xml文件,
%txt文件每行格式為:000002.jpg dog 44 28 132 121
%即每行由圖片名、目標類型、包圍框坐標組成,空格隔開
%如果一張圖片有多個目標,則格式如下:(比如兩個目標)
%000002.jpg dog 44 28 132 121
%000002.jpg car 50 27 140 110
%包圍框坐標為左上角和右下角
%作者:小咸魚_
%CSDN:http://blog.csdn.net/sinat_30071459
%%
clc;
clear;
%注意修改下面四個變量
imgpath='C:\Users\Administrator\Desktop\plane_master\code\makeDataset\Images\';%圖像存放文件夾
txtpath='C:\Users\Administrator\Desktop\plane_master\code\makeDataset\Images\output.txt';%txt文件
xmlpath_new='C:\Users\Administrator\Desktop\plane_master\code\makeDataset\Annotations/';%修改后的xml保存文件夾
foldername='VOC2007';%xml的folder字段名


fidin=fopen(txtpath,'r');
lastname='begin';

while ~feof(fidin)
     tline=fgetl(fidin);
     str = regexp(tline, ' ','split');
     filepath=[imgpath,str{1}];
     img=imread(filepath);
     [h,w,d]=size(img);
      imshow(img);
      rectangle('Position',[str2double(str{3}),str2double(str{4}),str2double(str{5})-str2double(str{3}),str2double(str{6})-str2double(str{4})],'LineWidth',4,'EdgeColor','r');
      pause(0.1);
      
        if strcmp(str{1},lastname)%如果文件名相等,只需增加object
           object_node=Createnode.createElement('object');
           Root.appendChild(object_node);
           node=Createnode.createElement('name');
           node.appendChild(Createnode.createTextNode(sprintf('%s',str{2})));
           object_node.appendChild(node);
          
           node=Createnode.createElement('pose');
           node.appendChild(Createnode.createTextNode(sprintf('%s','Unspecified')));
           object_node.appendChild(node);
          
           node=Createnode.createElement('truncated');
           node.appendChild(Createnode.createTextNode(sprintf('%s','0')));
           object_node.appendChild(node);

           node=Createnode.createElement('difficult');
           node.appendChild(Createnode.createTextNode(sprintf('%s','0')));
           object_node.appendChild(node);
          
           bndbox_node=Createnode.createElement('bndbox');
           object_node.appendChild(bndbox_node);

           node=Createnode.createElement('xmin');
           node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{3}))));
           bndbox_node.appendChild(node);

           node=Createnode.createElement('ymin');
           node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{4}))));
           bndbox_node.appendChild(node);

           node=Createnode.createElement('xmax');
           node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{5}))));
           bndbox_node.appendChild(node);

           node=Createnode.createElement('ymax');
           node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{6}))));
           bndbox_node.appendChild(node);
        else %如果文件名不等,則需要新建xml
           copyfile(filepath, 'JPEGImages');
            %先保存上一次的xml
           if exist('Createnode','var')
              tempname=lastname;
              tempname=strrep(tempname,'.jpg','.xml');
              xmlwrite(tempname,Createnode);   
           end
            
            
            Createnode=com.mathworks.xml.XMLUtils.createDocument('annotation');
            Root=Createnode.getDocumentElement;%根節點
            node=Createnode.createElement('folder');
            node.appendChild(Createnode.createTextNode(sprintf('%s',foldername)));
            Root.appendChild(node);
            node=Createnode.createElement('filename');
            node.appendChild(Createnode.createTextNode(sprintf('%s',str{1})));
            Root.appendChild(node);
            source_node=Createnode.createElement('source');
            Root.appendChild(source_node);
            node=Createnode.createElement('database');
            node.appendChild(Createnode.createTextNode(sprintf('My Database')));
            source_node.appendChild(node);
            node=Createnode.createElement('annotation');
            node.appendChild(Createnode.createTextNode(sprintf('VOC2007')));
            source_node.appendChild(node);

           node=Createnode.createElement('image');
           node.appendChild(Createnode.createTextNode(sprintf('flickr')));
           source_node.appendChild(node);

           node=Createnode.createElement('flickrid');
           node.appendChild(Createnode.createTextNode(sprintf('NULL')));
           source_node.appendChild(node);
           owner_node=Createnode.createElement('owner');
           Root.appendChild(owner_node);
           node=Createnode.createElement('flickrid');
           node.appendChild(Createnode.createTextNode(sprintf('NULL')));
           owner_node.appendChild(node);

           node=Createnode.createElement('name');
           node.appendChild(Createnode.createTextNode(sprintf('xiaoxianyu')));
           owner_node.appendChild(node);
           size_node=Createnode.createElement('size');
           Root.appendChild(size_node);

          node=Createnode.createElement('width');
          node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(w))));
          size_node.appendChild(node);

          node=Createnode.createElement('height');
          node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(h))));
          size_node.appendChild(node);

         node=Createnode.createElement('depth');
         node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(d))));
         size_node.appendChild(node);
         
          node=Createnode.createElement('segmented');
          node.appendChild(Createnode.createTextNode(sprintf('%s','0')));
          Root.appendChild(node);
          object_node=Createnode.createElement('object');
          Root.appendChild(object_node);
          node=Createnode.createElement('name');
          node.appendChild(Createnode.createTextNode(sprintf('%s',str{2})));
          object_node.appendChild(node);
          
          node=Createnode.createElement('pose');
          node.appendChild(Createnode.createTextNode(sprintf('%s','Unspecified')));
          object_node.appendChild(node);
          
          node=Createnode.createElement('truncated');
          node.appendChild(Createnode.createTextNode(sprintf('%s','0')));
          object_node.appendChild(node);

          node=Createnode.createElement('difficult');
          node.appendChild(Createnode.createTextNode(sprintf('%s','0')));
          object_node.appendChild(node);
          
          bndbox_node=Createnode.createElement('bndbox');
          object_node.appendChild(bndbox_node);

         node=Createnode.createElement('xmin');
         node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{3}))));
         bndbox_node.appendChild(node);

         node=Createnode.createElement('ymin');
         node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{4}))));
         bndbox_node.appendChild(node);

        node=Createnode.createElement('xmax');
        node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{5}))));
        bndbox_node.appendChild(node);

        node=Createnode.createElement('ymax');
        node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{6}))));
        bndbox_node.appendChild(node);
       
       lastname=str{1};
        end
        %處理最后一行
        if feof(fidin)
            tempname=lastname;
            tempname=strrep(tempname,'.jpg','.xml');
            xmlwrite(tempname,Createnode);
        end
end
fclose(fidin);

file=dir(pwd);
for i=1:length(file)
   if length(file(i).name)>=4 && strcmp(file(i).name(end-3:end),'.xml')
    fold=fopen(file(i).name,'r');
    fnew=fopen([xmlpath_new file(i).name],'w');
    line=1;
    while ~feof(fold)
        tline=fgetl(fold);
        if line==1
           line=2;
           continue;
        end
        expression = '   ';
        replace=char(9);
        newStr=regexprep(tline,expression,replace);
        fprintf(fnew,'%s\n',newStr);
    end
    fprintf('已處理%s\n',file(i).name);
    fclose(fold);
    fclose(fnew);
	delete(file(i).name);
   end
end  

4、利用下面這段代碼根據XML文件生成test.txt(測試集),train.txt(訓練集),val.txt(驗證集),trainval.txt(訓練和驗證集),trainval大概是整個數據集的50%,test也大概是整個數據集的50%;train大概是trainval的50%,val大概是trainval的50%。將這四個txt放在ImageSets\Main中。

function select_xml2txt()

%%
%該代碼根據已生成的xml,制作VOC2007數據集中的trainval.txt;train.txt;test.txt和val.txt
%trainval占總數據集的50%,test占總數據集的50%;train占trainval的50%,val占trainval的50%;
%上面所占百分比可根據自己的數據集修改,如果數據集比較少,test和val可少一些
%%
%注意修改下面四個值
xmlfilepath='C:\Users\Administrator\Desktop\plane_master\code\makeDataset\Annotations';
txtsavepath='C:\Users\Administrator\Desktop\plane_master\code\makeDataset\ImageSets\Main\';
trainval_percent=0.5;%trainval占整個數據集的百分比,剩下部分就是test所占百分比
train_percent=0.5;%train占trainval的百分比,剩下部分就是val所占百分比


%%
xmlfile=dir(xmlfilepath);
numOfxml=length(xmlfile)-2;%減去.和..  總的數據集大小


trainval=sort(randperm(numOfxml,floor(numOfxml*trainval_percent)));
test=sort(setdiff(1:numOfxml,trainval));


trainvalsize=length(trainval);%trainval的大小
train=sort(trainval(randperm(trainvalsize,floor(trainvalsize*train_percent))));
val=sort(setdiff(trainval,train));


ftrainval=fopen([txtsavepath 'trainval.txt'],'w');
ftest=fopen([txtsavepath 'test.txt'],'w');
ftrain=fopen([txtsavepath 'train.txt'],'w');
fval=fopen([txtsavepath 'val.txt'],'w');


for i=1:numOfxml
    if ismember(i,trainval)
        fprintf(ftrainval,'%s\r\n',xmlfile(i+2).name(1:end-4));
        if ismember(i,train)
            fprintf(ftrain,'%s\r\n',xmlfile(i+2).name(1:end-4));
        else
            fprintf(fval,'%s\r\n',xmlfile(i+2).name(1:end-4));
        end
    else
        fprintf(ftest,'%s\r\n',xmlfile(i+2).name(1:end-4));
    end
end
fclose(ftrainval);
fclose(ftrain);
fclose(fval);
fclose(ftest);

end  

5、最后新建文件夾JPEGImages,將所有訓練圖片放在這個文件夾里(注意不要把output.txt也放進去)

並且用自己生成的這三個文件夾來替換voc2007數據集中的Annotations、ImageSets和JPEGImages文件夾,自己的數據集就制作完成了,之后就是修改faster-rcnn源碼了。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM