使用OLEDB可以對excel文件進行讀取,我們只要把該excel文件作為數據源即可。
一 在D盤創建excel文件test.xls:
二 將工作表Sheet1的內容讀取到DataSet
string strConn = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:/test.xls;"+
"Extended Properties='Excel 8.0'";
DataSet ds = new DataSet();
OleDbDataAdapter oada = new OleDbDataAdapter("select * from [Sheet1$]", strConn);
oada.Fill(ds);
讀取的DataSet為:
從圖中可以看出excel文件中的第一行變成了DataSet中的列名,這正是系統的默認設置。
三 如果想把第一行也作為數據行,那我們可以給連接字符串添加一個HDR=No屬性如:
string strConn = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:/test.xls;"+
"Extended Properties='Excel 8.0;HDR=No'";
DataSet ds = new DataSet();
OleDbDataAdapter oada = new OleDbDataAdapter("select * from [Sheet1$]", strConn);
oada.Fill(ds);
結果也許會讓你有點想不到:
第一行的第一列和第三列都變成空的了,這是因為系統把第一列識別成了數字,把第三列識別成了日期,
而第一行的數據不符合格式的要求,所以就變成空的了。
四 我們還可以把所有列都做為字符串來讀取,只要添加屬性IMEX=1即可
string strConn = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:/test.xls;"+
"Extended Properties='Excel 8.0;HDR=No;IMEX=1'";
DataSet ds = new DataSet();
OleDbDataAdapter oada = new OleDbDataAdapter("select * from [Sheet1$]", strConn);
oada.Fill(ds);
結果又會如何呢?
是不是再次出乎你的意料,第三行的日期怎么變成數字了,其實excel在轉換格式的時候就自動把日期變成數字了,
那這個數字是怎么來的呢 ? 如果你把日期改成1900年1月1日,那么你可以看到他的轉換結果是1,以此類推,39902是哪一天就明白了吧。
這里解決辦法:
方法一:
public static string getDateStr(string strValue)
{
int i = Convert.ToInt32(strValue);
DateTime d1 = Convert.ToDateTime("1900-1-1");
DateTime d2 = d1.AddDays(i - 2);
string strTemp = d2.ToString("d");
return strTemp;
}
方法二:
DateTime.FromOADate(Convert.ToInt32(strValue)).ToString("d");
五 也許你並不想讀取整個excel的內容
如果只想讀取前兩列可以用:select * from [Sheet1$A:B]
如果只想讀取A1到B2的內容,就用:select * from [Sheet1$A1:B2]
六 如果不知道工作表的名字或名字被人為修改了該怎么辦呢?
我們可以通過索引來獲取指定工作表的名字,以下方法可以用來獲取工作表名稱的數組:
ArrayList al = new ArrayList();
string strConn;
strConn = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:/test.xls;"+
"Extended Properties=Excel 8.0;";
OleDbConnection conn = new OleDbConnection(strConn);
conn.Open();
DataTable sheetNames = conn.GetOleDbSchemaTable
(OleDbSchemaGuid.Tables, new object[] { null, null, null, "TABLE" });
conn.Close();
foreach (DataRow dr in sheetNames.Rows)
{
al.Add(dr[2]);
}
return al;
IMEX=1的時候並不是全都會作為字符串來處理,根據系統的默認設置,通常如果前8行有字符串,則該列會作為字符串來處理,如果全都為數字,則該列為數字列,日期也是一樣。
如果你覺得8行不夠或者太多了,則只能修改注冊表HKEY_LOCAL_MACHINE/Software/Microsoft/Jet/4.0/Engines/Excel/TypeGuessRows,如果此值為0,則會根據所有行來判斷使用什么類型,通常不建議這麽做,除非你的數據量確實比較少。
無法讀取EXCEL中的數據單元格。有數據,但是讀出來全是空值。
解決方法:
1.在導入數據連接字符串中,將IMEX=1加入,“Provider=Microsoft.Jet.OLEDB.4.0;Data Source="C:\Data.xls";Extended Properties="Excel 8.0;HDR=Yes;IMEX=1; ”,這樣就可以。
注:
“HDR=Yes;”指示第一行中包含列名,而不是數據;
“IMEX=1;”通知驅動程
序始終將“互混”數據列作為文本讀取。
兩者必須一起使用。
本以為這樣就OK了。但在實際使用過程中,這樣設置還是不行,查閱了不少資料才發現,原來還有一個注冊表里的信息需要修改,這樣帶能讓excel不再使用前8行的內容來確定該列的類型。
注冊表修改內容如下:
在HKEY_LOCAL_MACHINE\Software\Microsoft\Jet\4.0\Engines\Excel有一個TypeGuessRows值,預設是8,表示會先讀取前8列來決定每一個欄位的型態,所以如果前8列的資料都是數字,到了第9列以后出現的文字資料都會變成null,所以如果要解決這個問題,只要把TypeGuessRows機碼值改成0,就可以解這個問題了。
asp.net 解決使用OLEDB導入excel數據時同時包含文本和數字的列無法正常讀取情況
1.連接語句中必須包含IMEX=1
EXCEL2003:Provider=Microsoft.Jet.OLEDB.4.0;Data Source='文件路徑';Extended Properties=Excel 8.0;HDR=Yes;IMEX=1
EXCEL2007:Provider=Microsoft.ACE.OLEDB.12.0;Data Source='文件路徑';Extended Properties=Excel 12.0;HDR=Yes;IMEX=1
2.設置注冊表信息:【HKEY_LOCAL_MACHINE/Software/Microsoft/Jet/4.0/Engines/Excel/】
ImportMixedType :Text (注:值為Text,則該列為文本;值為Majority Type,則取數據多的類型)
TypeGuessRows :0 (注:0表示要讀取所有數據再來判斷是否是混合類型)
OLEDB 連接 Excel 中的 HDR 與 IMEX 解釋
Microsoft.Jet.OleDb 連接 Excel,就像數據庫一樣操作 Excel,以下是一個示例的連接字符串:
HDR
HDR 表示第一行是否是標題行。
- 若為 YES,則第一行是標題行(即列名稱),不是數據;
- 若為 NO,則第一行不是標題行,跟后面的行一樣,是數據。
IMEX
即 intermixed,表示混合數據類型時如何處理。Excel 不像 Access 樣,Access 每一字段(列)具有數據類型,Excel 不具有,所以 Excel 第一行第一列可以存儲字符串,第二行第一列又可以存儲數字……同樣的列,存儲不同的數據類型,這就形成了混合數據類型。
如果我們的 Excel 不存在混合數據類型,則可以省略 IMEX;如果我們的 Excel 存在混合數據類型,則需要正確指定 IMEX,否則 OLEDB 很可能錯誤地判斷數據類型,導致讀取出來的數據是空白,甚至讀取不到行等錯誤。
- 若為 0,則為輸出模式,此情況下只能用作寫入 Excel;
- 若為 1,則為輸入模式,此情況下只能用作讀取 Excel,並且始終將 Excel 數據作為文本類型讀取;
- 若為 2,則為連接模式,此情況下既可用作寫入、也可用作讀取。
所以若要讀取混合數據類型,應該將 IMEX 設置為 1;若誤設置為 0,則讀取不到任何行;若誤設置為 2 或省略,則有些數據讀取出來是空白。
注意:輸出模式對應寫入、輸入模式對應讀取。
Microsoft.Jet.OleDb 連接 Excel,就像數據庫一樣操作 Excel,以下是一個示例的連接字符串:
HDR
HDR 表示第一行是否是標題行。
- 若為 YES,則第一行是標題行(即列名稱),不是數據;
- 若為 NO,則第一行不是標題行,跟后面的行一樣,是數據。
IMEX
即 intermixed,表示混合數據類型時如何處理。Excel 不像 Access 樣,Access 每一字段(列)具有數據類型,Excel 不具有,所以 Excel 第一行第一列可以存儲字符串,第二行第一列又可以存儲數字……同樣的列,存儲不同的數據類型,這就形成了混合數據類型。
如果我們的 Excel 不存在混合數據類型,則可以省略 IMEX;如果我們的 Excel 存在混合數據類型,則需要正確指定 IMEX,否則 OLEDB 很可能錯誤地判斷數據類型,導致讀取出來的數據是空白,甚至讀取不到行等錯誤。
- 若為 0,則為輸出模式,此情況下只能用作寫入 Excel;
- 若為 1,則為輸入模式,此情況下只能用作讀取 Excel,並且始終將 Excel 數據作為文本類型讀取;
- 若為 2,則為連接模式,此情況下既可用作寫入、也可用作讀取。
所以若要讀取混合數據類型,應該將 IMEX 設置為 1;若誤設置為 0,則讀取不到任何行;若誤設置為 2 或省略,則有些數據讀取出來是空白。
注意:輸出模式對應寫入、輸入模式對應讀取。
Microsoft.Jet.OleDb 連接 Excel,就像數據庫一樣操作 Excel,以下是一個示例的連接字符串:
HDR
HDR 表示第一行是否是標題行。
- 若為 YES,則第一行是標題行(即列名稱),不是數據;
- 若為 NO,則第一行不是標題行,跟后面的行一樣,是數據。
IMEX
即 intermixed,表示混合數據類型時如何處理。Excel 不像 Access 樣,Access 每一字段(列)具有數據類型,Excel 不具有,所以 Excel 第一行第一列可以存儲字符串,第二行第一列又可以存儲數字……同樣的列,存儲不同的數據類型,這就形成了混合數據類型。
如果我們的 Excel 不存在混合數據類型,則可以省略 IMEX;如果我們的 Excel 存在混合數據類型,則需要正確指定 IMEX,否則 OLEDB 很可能錯誤地判斷數據類型,導致讀取出來的數據是空白,甚至讀取不到行等錯誤。
- 若為 0,則為輸出模式,此情況下只能用作寫入 Excel;
- 若為 1,則為輸入模式,此情況下只能用作讀取 Excel,並且始終將 Excel 數據作為文本類型讀取;
- 若為 2,則為連接模式,此情況下既可用作寫入、也可用作讀取。
所以若要讀取混合數據類型,應該將 IMEX 設置為 1;若誤設置為 0,則讀取不到任何行;若誤設置為 2 或省略,則有些數據讀取出來是空白。
注意:輸出模式對應寫入、輸入模式對應讀取。
(http://blog.csdn.net/chenxiang199055/article/details/20051075)
在使用Microsoft.Jet.OLEDB.4.0連接Excel,進行讀取數據,相對使用傳統的COM來讀取數據,效率是很高的。但相對傳統COM操作Excel來說,及存在數據類型轉換的問題。
因為使用OLEDB連接Excel讀取數據時,需要確定數據的類型。默認情況使用連接字符串:
view source
print ?
1. string connStr = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=" + excelFile + ";Extended Properties='Excel 8.0;'";
使用上面的連接字符串連接Excel時,可能會遇到數據類型不一致的問題。所謂數據類型不一致,是指同一列里面數據類型可能出現多種,如浮點數、字符串、日期等;當出現此類情況時,讀取出來的數據就為空,甚至會報錯,如“非法的日期格式”等異常。出現這種問題,我們大家都會想到把數據全部都按字符數據來讀取,但是按什么數據類型來讀取不是我們能控制的,是OLEDB控制的,至少暫時我還沒有找到能控制輸出數據類型的方法。因為我當初也嘗試使用convert,cast函數對輸出的列進行類型轉換,但oledb連接Excel時,使用的SQL不支持這些函數。因此只能從其他角度來解決該問題。我也在網上搜索了很多解決方法,最全面的解決方法是:http://www.douban.com/note/18510346/。下面列出了網上出現解決該問題方法的比較
這里提供一個更加方便的辦法,不過前提是第一行必須是作為字段名或者第一行的數據類型就為字符型。這樣一說,大家就明白了。首先修改連接字符串為:
- view source
- print ?
- //2003(Microsoft.Jet.Oledb.4.0)
- string strConn = string.Format("Provider=Microsoft.Jet.OLEDB.4.0;Data Source={0};Extended Properties='Excel 8.0;HDR=Yes;IMEX=1;'", excelFilePath);
- //2010(Microsoft.ACE.OLEDB.12.0)
- string strConn = string.Format("Provider=Microsoft.ACE.OLEDB.12.0;Data Source={0};Extended Properties='Excel 8.0;HDR=Yes;IMEX=1;'", excelFilePath);
這里將HDR設為NO,因為我就是將第一行做為數據讀取,而IMEX=1就表示根據前8行判斷列的數據類型,如果有字符型數據,那么就強制混合數據轉換為 文本。這里就明白為什么要保證第一行為字符型的原因了。能將列的數據類型強制設為字符型,那么列中出現什么類型的數據都不怕了。需要做的工作就是,在獲取 完數據后,將字段名重新設置,並刪除第一條記錄即可。代碼如下:
- view source
- print ?
- 01. DataTable dt = new DataTable();
- 02.
- 03. using(OleDbCommand cmd = new OleDbCommand()){
- 04. cmd.Connection = conn;
- 05. cmd.CommandType = CommandType.Text;
- 06. cmd.CommandTimeout = 6;
- 07. cmd.CommandText = string.Format("select * from [{0}$]", sheetName);
- 08.
- 09. OleDbDataAdapter adapter = new OleDbDataAdapter(cmd);
- 10. adapter.Fill(dt);
- 11. }
- 12.
- 13. if (dt.Rows.Count > 0) {
- 14. DataRow dr = dt.Rows[0];
- 15.
- 16. for (int col = 0; col < dt.Columns.Count; col++) {
- 17. dt.Columns[col].ColumnName = dr[col].ToString();
- 18. }
- 19.
- 20. dt.Rows[0].Delete();
- 21. dt.AcceptChanges();
- 22. }
(http://mobile.51cto.com/aprogram-450102.htm)