主要參考下面這個博客:
http://blog.csdn.net/sinat_30071459/article/details/50723212
1、首先對圖片按照VOC2007里面圖片的格式進行重命名
function imgName( ) path = 'C:\Users\lenovo\Desktop\racket_dect\paizi\';%所有圖片存放的路徑 D = dir([path '*.jpg']);%將該路徑下的所有文件讀取成一個結構體 for i = 1:length(D)%遍歷每一張圖片 image_name = D(i).name;%每一張圖片的名字 I = imread(strcat(path,image_name));%讀取每一張圖片 nz = strcat('%0',num2str(6),'d');%給該圖片重命名名字的位數 temp_id = sprintf(nz,i);%按序數給所有圖片命名,前面補0 name2 = strcat(temp_id,'.jpg'); imwrite(I,name2);%以新名字保存圖片 end end
2、用腳本程序對圖片進行標注
注意在腳本程序標注的過程中,按一下m再按n,這樣才能成功將你標注的矩形框坐標保存在output.txt中
利用腳本程序把所有圖片標注完了后,首先用下面這個程序對生成的output.txt文件中的內容進行一些修改
clc clear all close all fidin1=fopen('C:\Users\lenovo\Desktop\racket_dect\paizi\output.txt','r+');% 需要讀取的文件 i=0; while ~feof(fidin1) tline=fgetl(fidin1);%讀取一行 i=i+1; %fprintf(fidout,'%s\n',tline); newtline{i}=tline; newtline{i}=strrep(tline,'m','person');%替換的函數 end fclose(fidin1); %%重新以寫的形式打開,寫入覆蓋原來的內容 fidin1=fopen('C:\Users\lenovo\Desktop\racket_dect\拍子\output.txt','w+'); for j=1:1:i fprintf(fidin1,'%s\r\n',newtline{j}); end fclose(fidin1); end
接下來是新建兩個文件夾:
新建文件夾Annotations,將之后生成的XML文件全部放到該文件夾里。
新建文件夾ImageSets,並在ImageSets里再新建文件夾,命名為Main。
我們可以通過xml名字(或圖片名),生成四個txt文件,保存在Main中。
3、利用下面這段代碼將這個output文件轉化成XML文件,每張圖對應一個XML文件
%% %該代碼可以做voc2007數據集中的xml文件, %txt文件每行格式為:000002.jpg dog 44 28 132 121 %即每行由圖片名、目標類型、包圍框坐標組成,空格隔開 %如果一張圖片有多個目標,則格式如下:(比如兩個目標) %000002.jpg dog 44 28 132 121 %000002.jpg car 50 27 140 110 %包圍框坐標為左上角和右下角 %作者:小咸魚_ %CSDN:http://blog.csdn.net/sinat_30071459 %% clc; clear; %注意修改下面四個變量 imgpath='C:\Users\Administrator\Desktop\plane_master\code\makeDataset\Images\';%圖像存放文件夾 txtpath='C:\Users\Administrator\Desktop\plane_master\code\makeDataset\Images\output.txt';%txt文件 xmlpath_new='C:\Users\Administrator\Desktop\plane_master\code\makeDataset\Annotations/';%修改后的xml保存文件夾 foldername='VOC2007';%xml的folder字段名 fidin=fopen(txtpath,'r'); lastname='begin'; while ~feof(fidin) tline=fgetl(fidin); str = regexp(tline, ' ','split'); filepath=[imgpath,str{1}]; img=imread(filepath); [h,w,d]=size(img); imshow(img); rectangle('Position',[str2double(str{3}),str2double(str{4}),str2double(str{5})-str2double(str{3}),str2double(str{6})-str2double(str{4})],'LineWidth',4,'EdgeColor','r'); pause(0.1); if strcmp(str{1},lastname)%如果文件名相等,只需增加object object_node=Createnode.createElement('object'); Root.appendChild(object_node); node=Createnode.createElement('name'); node.appendChild(Createnode.createTextNode(sprintf('%s',str{2}))); object_node.appendChild(node); node=Createnode.createElement('pose'); node.appendChild(Createnode.createTextNode(sprintf('%s','Unspecified'))); object_node.appendChild(node); node=Createnode.createElement('truncated'); node.appendChild(Createnode.createTextNode(sprintf('%s','0'))); object_node.appendChild(node); node=Createnode.createElement('difficult'); node.appendChild(Createnode.createTextNode(sprintf('%s','0'))); object_node.appendChild(node); bndbox_node=Createnode.createElement('bndbox'); object_node.appendChild(bndbox_node); node=Createnode.createElement('xmin'); node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{3})))); bndbox_node.appendChild(node); node=Createnode.createElement('ymin'); node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{4})))); bndbox_node.appendChild(node); node=Createnode.createElement('xmax'); node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{5})))); bndbox_node.appendChild(node); node=Createnode.createElement('ymax'); node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{6})))); bndbox_node.appendChild(node); else %如果文件名不等,則需要新建xml copyfile(filepath, 'JPEGImages'); %先保存上一次的xml if exist('Createnode','var') tempname=lastname; tempname=strrep(tempname,'.jpg','.xml'); xmlwrite(tempname,Createnode); end Createnode=com.mathworks.xml.XMLUtils.createDocument('annotation'); Root=Createnode.getDocumentElement;%根節點 node=Createnode.createElement('folder'); node.appendChild(Createnode.createTextNode(sprintf('%s',foldername))); Root.appendChild(node); node=Createnode.createElement('filename'); node.appendChild(Createnode.createTextNode(sprintf('%s',str{1}))); Root.appendChild(node); source_node=Createnode.createElement('source'); Root.appendChild(source_node); node=Createnode.createElement('database'); node.appendChild(Createnode.createTextNode(sprintf('My Database'))); source_node.appendChild(node); node=Createnode.createElement('annotation'); node.appendChild(Createnode.createTextNode(sprintf('VOC2007'))); source_node.appendChild(node); node=Createnode.createElement('image'); node.appendChild(Createnode.createTextNode(sprintf('flickr'))); source_node.appendChild(node); node=Createnode.createElement('flickrid'); node.appendChild(Createnode.createTextNode(sprintf('NULL'))); source_node.appendChild(node); owner_node=Createnode.createElement('owner'); Root.appendChild(owner_node); node=Createnode.createElement('flickrid'); node.appendChild(Createnode.createTextNode(sprintf('NULL'))); owner_node.appendChild(node); node=Createnode.createElement('name'); node.appendChild(Createnode.createTextNode(sprintf('xiaoxianyu'))); owner_node.appendChild(node); size_node=Createnode.createElement('size'); Root.appendChild(size_node); node=Createnode.createElement('width'); node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(w)))); size_node.appendChild(node); node=Createnode.createElement('height'); node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(h)))); size_node.appendChild(node); node=Createnode.createElement('depth'); node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(d)))); size_node.appendChild(node); node=Createnode.createElement('segmented'); node.appendChild(Createnode.createTextNode(sprintf('%s','0'))); Root.appendChild(node); object_node=Createnode.createElement('object'); Root.appendChild(object_node); node=Createnode.createElement('name'); node.appendChild(Createnode.createTextNode(sprintf('%s',str{2}))); object_node.appendChild(node); node=Createnode.createElement('pose'); node.appendChild(Createnode.createTextNode(sprintf('%s','Unspecified'))); object_node.appendChild(node); node=Createnode.createElement('truncated'); node.appendChild(Createnode.createTextNode(sprintf('%s','0'))); object_node.appendChild(node); node=Createnode.createElement('difficult'); node.appendChild(Createnode.createTextNode(sprintf('%s','0'))); object_node.appendChild(node); bndbox_node=Createnode.createElement('bndbox'); object_node.appendChild(bndbox_node); node=Createnode.createElement('xmin'); node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{3})))); bndbox_node.appendChild(node); node=Createnode.createElement('ymin'); node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{4})))); bndbox_node.appendChild(node); node=Createnode.createElement('xmax'); node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{5})))); bndbox_node.appendChild(node); node=Createnode.createElement('ymax'); node.appendChild(Createnode.createTextNode(sprintf('%s',num2str(str{6})))); bndbox_node.appendChild(node); lastname=str{1}; end %處理最后一行 if feof(fidin) tempname=lastname; tempname=strrep(tempname,'.jpg','.xml'); xmlwrite(tempname,Createnode); end end fclose(fidin); file=dir(pwd); for i=1:length(file) if length(file(i).name)>=4 && strcmp(file(i).name(end-3:end),'.xml') fold=fopen(file(i).name,'r'); fnew=fopen([xmlpath_new file(i).name],'w'); line=1; while ~feof(fold) tline=fgetl(fold); if line==1 line=2; continue; end expression = ' '; replace=char(9); newStr=regexprep(tline,expression,replace); fprintf(fnew,'%s\n',newStr); end fprintf('已處理%s\n',file(i).name); fclose(fold); fclose(fnew); delete(file(i).name); end end
4、利用下面這段代碼根據XML文件生成test.txt(測試集),train.txt(訓練集),val.txt(驗證集),trainval.txt(訓練和驗證集),trainval大概是整個數據集的50%,test也大概是整個數據集的50%;train大概是trainval的50%,val大概是trainval的50%。將這四個txt放在ImageSets\Main中。
function select_xml2txt() %% %該代碼根據已生成的xml,制作VOC2007數據集中的trainval.txt;train.txt;test.txt和val.txt %trainval占總數據集的50%,test占總數據集的50%;train占trainval的50%,val占trainval的50%; %上面所占百分比可根據自己的數據集修改,如果數據集比較少,test和val可少一些 %% %注意修改下面四個值 xmlfilepath='C:\Users\Administrator\Desktop\plane_master\code\makeDataset\Annotations'; txtsavepath='C:\Users\Administrator\Desktop\plane_master\code\makeDataset\ImageSets\Main\'; trainval_percent=0.5;%trainval占整個數據集的百分比,剩下部分就是test所占百分比 train_percent=0.5;%train占trainval的百分比,剩下部分就是val所占百分比 %% xmlfile=dir(xmlfilepath); numOfxml=length(xmlfile)-2;%減去.和.. 總的數據集大小 trainval=sort(randperm(numOfxml,floor(numOfxml*trainval_percent))); test=sort(setdiff(1:numOfxml,trainval)); trainvalsize=length(trainval);%trainval的大小 train=sort(trainval(randperm(trainvalsize,floor(trainvalsize*train_percent)))); val=sort(setdiff(trainval,train)); ftrainval=fopen([txtsavepath 'trainval.txt'],'w'); ftest=fopen([txtsavepath 'test.txt'],'w'); ftrain=fopen([txtsavepath 'train.txt'],'w'); fval=fopen([txtsavepath 'val.txt'],'w'); for i=1:numOfxml if ismember(i,trainval) fprintf(ftrainval,'%s\r\n',xmlfile(i+2).name(1:end-4)); if ismember(i,train) fprintf(ftrain,'%s\r\n',xmlfile(i+2).name(1:end-4)); else fprintf(fval,'%s\r\n',xmlfile(i+2).name(1:end-4)); end else fprintf(ftest,'%s\r\n',xmlfile(i+2).name(1:end-4)); end end fclose(ftrainval); fclose(ftrain); fclose(fval); fclose(ftest); end
5、最后新建文件夾JPEGImages,將所有訓練圖片放在這個文件夾里(注意不要把output.txt也放進去)
並且用自己生成的這三個文件夾來替換voc2007數據集中的Annotations、ImageSets和JPEGImages文件夾,自己的數據集就制作完成了,之后就是修改faster-rcnn源碼了。