CSV-逗號分隔符(Comma-Separatored Values,有時也可用字符分隔符,分隔字符不一定要使用逗號)
典型分隔符是逗號,分號或制表符
excel表格可以打開csv文件,如果分隔符使用的是逗號的話,表格可以按逗號分隔,但如果不是逗號的話,並不能分隔
新建一個文件test.csv(利用逗號分隔):
hello,world
hai,hi
利用excel表格打開
新建另一個文件test2.csv(利用分號分隔):
並沒有按分號分隔
所以如果我們想要讀取表格數據時,可以先將表格保存為csv文件,然后利用分隔符’,'讀取表格數據
有時我們想要在數據中使用分隔符這時可以用雙引號:
test3.csv:
"adsf,asdfa",323
gadfasf,23
#########################################################
C++實現
寫入CSV文件:
#include <iostream>
#include <fstream>
#include <sstream>
#include <string>
#include <vector>
#include <io.h>
#include <time.h>
#include <direct.h>
#include <algorithm>
using namespace std;
//圖片地址
const char *address="D:\\VSProject\\CSVTest\\CSVTest\\images\\";
//csv存儲地址
const char *csv_addr="D:\\VSProject\\CSVTest\\CSVTest\\images.csv";
/** * @function: 獲取cate_dir目錄下的所有文件名 * @param: cate_dir - const char指針類型 * @result:vector<string>類型 */
vector<string> getFiles(const char *cate_dir)
{
vector<string> files;//存放文件名
#ifdef WIN32
_finddata_t file;
long lf;
//輸入文件夾路徑
if ((lf=_findfirst(cate_dir, &file)) == -1) {
cout<<cate_dir<<" not found!!!"<<endl;
} else {
while(_findnext(lf, &file) == 0) {
//輸出文件名
//cout<<file.name<<endl;
if (strcmp(file.name, ".") == 0 || strcmp(file.name, "..") == 0)
continue;
files.push_back(file.name);
}
}
_findclose(lf);
#endif
#ifdef linux
DIR *dir;
struct dirent *ptr;
char base[1000];
if ((dir=opendir(cate_dir)) == NULL)
{
perror("Open dir error...");
exit(1);
}
while ((ptr=readdir(dir)) != NULL)
{
if(strcmp(ptr->d_name,".")==0 || strcmp(ptr->d_name,"..")==0) ///current dir OR parrent dir
continue;
else if(ptr->d_type == 8) ///file
//printf("d_name:%s/%s\n",basePath,ptr->d_name);
files.push_back(ptr->d_name);
else if(ptr->d_type == 10) ///link file
//printf("d_name:%s/%s\n",basePath,ptr->d_name);
continue;
else if(ptr->d_type == 4) ///dir
{
files.push_back(ptr->d_name);
/* memset(base,'\0',sizeof(base)); strcpy(base,basePath); strcat(base,"/"); strcat(base,ptr->d_nSame); readFileList(base); */
}
}
closedir(dir);
#endif
//排序,按從小到大排序
sort(files.begin(), files.end());
return files;
}
/** * @function: 將圖片信息以及對應ID寫入文件,保存為csv格式 * @param: images - const vector<string>類型,圖片地址 * @param: labels - const vector<int>類型,圖片ID * @param: addr - const char指針類型,存儲地址 * @param: separator - char類型,分隔符,默認值為';' */
bool write_csv(const vector<string> images, const vector<int> labels, const char *addr, char separator=';')
{
ofstream fout(addr);
if (!fout.is_open())
{
cout<<addr<<" could not open "<<endl;
return false;
}
for (int i=0; i<(int)images.size(); i++)
{
fout<<images[i];
fout<<separator;
fout<<labels[i]<<endl;
}
fout.close();
return true;
}
int main()
{
//獲取所有類別地址
string image_address=(string)address+"*";
vector<string> cates=getFiles(image_address.c_str());
//圖片地址
vector<string> images;
//圖片ID
vector<int> labels;
for (int i=0; i<(int)cates.size(); i++)
{
//獲取類別絕對地址
string cate_dir=(string)address+cates[i];
//獲取圖片
string cate_addr=cate_dir+"\\*";
vector<string> imgs=getFiles(cate_addr.c_str());
//判斷圖片是否存在
if ((int)imgs.size() == 0)
{
cout<<cate_dir<<" can not find any images"<<endl;
exit(1);
}
//設置絕對地址
for (int j=0; j<(int)imgs.size(); j++)
{
string img_dir=cate_dir+"\\"+imgs[j];
images.push_back(img_dir);
labels.push_back(i+1);
}
}
time_t start=clock();
//制作csv文件
write_csv(images, labels, csv_addr);
time_t end=clock();
double time=(double)(end-start)/CLOCKS_PER_SEC; //計算函數使用時間,以秒計
cout<<"write_csv() need time is "<<time<<" s."<<endl;
cout<<"end..."<<endl;
cin.get();
return 0;
}
讀出CSV文件:
static void read_csv(const string& filename, vector<Mat>& images, vector<int>& labels, char separator = ';') {
std::ifstream file(filename.c_str(), ifstream::in);
if (!file) {
string error_message = "No valid input file was given, please check the given filename.";
CV_Error(CV_StsBadArg, error_message);
}
string line, path, classlabel;
while (getline(file, line)) {
stringstream liness(line);
getline(liness, path, separator);
getline(liness, classlabel);
if(!path.empty() && !classlabel.empty()) {
images.push_back(imread(path, 0));
labels.push_back(atoi(classlabel.c_str()));
}
}
}
#########################################################
python實現:
#!/usr/bin/env python
#-*- coding: utf-8 -*-
''' 實現csv文件的讀出,寫入功能 '''
__author__ = 'zj'
import time
import os
#csv文件寫入,默認分隔符是';'
#參數csv_name表示存儲地址
#參數rows_list存儲寫入內容,是列表類型,每個元素代表一行輸入內容,同樣是列表類型
#例:rows_list=[[23,53,'123'], [434, 3, 'dfgv']]
def write_csv(csv_name, rows_list, separator=';'):
start=time.clock()
#打開文件
fi=open(csv_name, 'w')
#遍歷每一行
for row in rows_list:
#遍歷每一列
for col in row:
fi.write(str(col))
fi.write(separator)
#endfor
fi.write("\n")
#endfor
fi.close()
end=time.clock()
print 'write_csv function need time :%f s'%(end-start)
#end of write_csv
#csv文件讀出,默認分隔符是';'
#參數csv_name表示存儲地址
#參數rows_list存儲寫出內容,是列表類型,每個元素代表一行輸入內容,同樣是列表類型
#例:rows_list=[[23,53,'123'], [434, 3, 'dfgv']]
def read_csv(csv_name, rows_list, separator=';'):
start=time.clock()
#打開文件
fi=open(csv_name, 'r')
#讀取每一行
for line in fi.readlines():
#分隔每一列
cols=line.split(separator)
rows_list.append(cols)
#endfor
fi.close()
end=time.clock()
print 'read_csv function need time :%f s'%(end-start)
#end of read_csv
if __name__ == '__main__':
#設置存儲地址
address=os.path.join(os.getcwd(), "test.csv")
#設置存儲內容
rows_list=[[23,53,'123'], [434, 3, 'dfgv']]
#寫入csv文件
write_csv(address, rows_list, ';')
lists=[]
#讀出csv文件
read_csv(address, lists, ';')
for line in lists:
for param in line:
print param+" ",
#endfor
print
#endfor
#endif
參考:
http://baike.baidu.com/link?url=dFr4aesUK_f_SoTqTL4jQ8DwXAQkxRC5iB3Qkj_nw13j6Nai0HcWzciRmXlUCT5ii_yiWQ3bWlalg8i1mHnO0XLWTesNEkMwSmtpPMRDyUO