在網上找的資料都不怎么好使,許多代碼一看就知道根本沒有考慮全面。
最后找到一個好用的,在codeproject上,這位老兄寫成了一個framework,太重了。
http://www.codeproject.com/Articles/9258/A-Fast-CSV-Reader
確實挺好用的。
我沒耐下性子看他的實現,自己嘗試寫了如下的代碼來完成了閱讀csv.
參照:http://msdn.microsoft.com/en-us/library/ae5bf541%28v=vs.90%29.aspx
只寫了兩個方法,組織得不是特別優雅。
使用的時候只需要調用ReadCsv2DT即可,傳入參數是文件路徑和第一行是否是Header的布爾值。
第二個方法是替換CSVWriter封裝的多余的雙引號。
public static DataTable ReadCsv2DT(string filename,bool isFirstLineHeader) { DataTable dt = new DataTable(); int quotecount = 0; int lastbyte = 0; int b = 0; DataRow dr = null; bool isfirstline = true; int colindex = 0; List<string> firstlinefields = new List<string>(); StringBuilder sb = new StringBuilder(); using (FileStream fs = File.OpenRead(filename)) { while ((b = fs.ReadByte()) != -1) { if (!isfirstline && dr == null) dr = dt.NewRow(); if (b == 10 && lastbyte == 13 && quotecount % 2 == 0) //one row finished { if (!isfirstline) { dr[colindex] = removeTextQualifier(sb.ToString()); dt.Rows.Add(dr); } else { if (isFirstLineHeader) dt.Columns.Add(removeTextQualifier(sb.ToString())); else firstlinefields.Add(removeTextQualifier(sb.ToString())); //build the table strucure if (isfirstline && !isFirstLineHeader) { for (int i = 1; i <= firstlinefields.Count; i++) { dt.Columns.Add("col" + i); } dr = dt.NewRow(); for (int j = 0; j < firstlinefields.Count; j++) { dr[j] = firstlinefields[j]; } dt.Rows.Add(dr); } isfirstline = false; } sb.Clear(); quotecount = 0; b = 0; dr = null; colindex = 0; lastbyte = 0; } else if (b == 44 && quotecount % 2 == 0) //one filed found 44 stand for comma { if (isfirstline) { if (isFirstLineHeader) dt.Columns.Add(removeTextQualifier(sb.ToString())); else firstlinefields.Add(removeTextQualifier(sb.ToString())); } else dr[colindex] =removeTextQualifier(sb.ToString()); sb.Clear(); colindex++; } else { if (b == 34) quotecount++; //" lastbyte = b; sb.Append(UnicodeEncoding.ASCII.GetString(new byte[] { byte.Parse(b.ToString()) })); } } }; return dt; } public static string removeTextQualifier(string text) { string pattern = "^\"(?<word>[\\s\\S]*?)\"[\r\n]*$"; Regex rgx = new Regex(pattern,RegexOptions.Multiline); Match m = rgx.Match(text); if (m.Success) //return m.Result("($1)").Replace("\"\"", "\""); return m.Groups["word"].Value.Replace("\"\"", "\""); else return text.Replace("\"\"", "\""); } }
效果圖:測試了一個文件,效果還可以,和Excel打開顯示的無差異。
如果你需要測試的話,請確保自己寫的文件是有效的csv文件,否則請使用excel另存為,自己寫的文件改后綴不是真正的csv.