今天碰到一個問題需要想EXCEL表中寫數據,折騰了好久才發現是IMEX惹得禍,所以記錄下提醒自己,也希望大家不要出同樣的錯。
碰到問題:使用語句 "insert into [Sheet1$] (大類) values ('test')" 無法插入 。
原因:Provider=Microsoft.Jet.OLEDB.4.0;Data Source='2008-08.xls'; Extended Properties='Excel 8.0;HDR=Yes;IMEX=1'
解決方法: 去掉IMEX=1
補充:
向EXCEL插入數據時 數據類型是由前8行數據中數據類型占優選擇 例如:分數一列前前8行為空值 插入5為字符串格式,如果前8行為數字格式 插入5為數字格式關於IMEX的資料:
IMEX是用來告訴驅動程序使用Excel文件的模式,其值有0、1、2三種,分別代表導出、導入、混合模式。當我們設置IMEX=1時將強制混合數據轉換為文本,但僅僅這種設置並不可靠,IMEX=1只確保在某列前8行數據至少有一個是文本項的時候才起作用,它只是把查找前8行數據中數據類型占優選擇的行為作了略微的改變。例如某列前8行數據全為純數字,那么它仍然以數字類型作為該列的數據類型,隨后行里的含有文本的數據仍然變空。
另一個改進的措施是IMEX=1與注冊表值TypeGuessRows配合使用,TypeGuessRows 值決定了ISAM 驅動程序從前幾條數據采樣確定數據類型,默認為“8”。可以通過修改“HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Jet\4.0\Engines\Excel”下的該注冊表值來更改采樣行數。但是這種改進還是沒有根本上解決問題,即使我們把IMEX設為“1”, TypeGuessRows設得再大,例如1000,假設數據表有1001行,某列前1000行全為純數字,該列的第1001行又是一個文本,ISAM驅動的這種機制還是讓這列的數據變成空。
解決辦法:
使用OLEDB可以對excel文件進行讀取,我們只要把該excel文件作為數據源即可。
一 在D盤創建excel文件test.xls:
二 將工作表Sheet1的內容讀取到DataSet
string strConn = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:/test.xls;"+
"Extended Properties='Excel 8.0'";
DataSet ds = new DataSet();
OleDbDataAdapter oada = new OleDbDataAdapter("select * from [Sheet1$]", strConn);
oada.Fill(ds);
讀取的DataSet為:
從圖中可以看出excel文件中的第一行變成了DataSet中的列名,這正是系統的默認設置。
三 如果想把第一行也作為數據行,那我們可以給連接字符串添加一個HDR=No屬性如:
string strConn = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:/test.xls;"+
"Extended Properties='Excel 8.0;HDR=No'";
DataSet ds = new DataSet();
OleDbDataAdapter oada = new OleDbDataAdapter("select * from [Sheet1$]", strConn);
oada.Fill(ds);
結果也許會讓你有點想不到:
第一行的第一列和第三列都變成空的了,這是因為系統把第一列識別成了數字,把第三列識別成了日期,
而第一行的數據不符合格式的要求,所以就變成空的了。
四 我們還可以把所有列都做為字符串來讀取,只要添加屬性IMEX=1即可
string strConn = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:/test.xls;"+
"Extended Properties='Excel 8.0;HDR=No;IMEX=1'";
DataSet ds = new DataSet();
OleDbDataAdapter oada = new OleDbDataAdapter("select * from [Sheet1$]", strConn);
oada.Fill(ds);
結果又會如何呢?
是不是再次出乎你的意料,第三行的日期怎么變成數字了,其實excel在轉換格式的時候就自動把日期變成數字了,
那這個數字是怎么來的呢 ? 如果你把日期改成1900年1月1日,那么你可以看到他的轉換結果是1,以此類推,39902是哪一天就明白了吧。
這里解決辦法:
方法一:
public static string getDateStr(string strValue)
{
int i = Convert.ToInt32(strValue);
DateTime d1 = Convert.ToDateTime("1900-1-1");
DateTime d2 = d1.AddDays(i - 2);
string strTemp = d2.ToString("d");
return strTemp;
}
方法二:
DateTime.FromOADate(Convert.ToInt32(strValue)).ToString("d");
五 也許你並不想讀取整個excel的內容
如果只想讀取前兩列可以用:select * from [Sheet1$A:B]
如果只想讀取A1到B2的內容,就用:select * from [Sheet1$A1:B2]
六 如果不知道工作表的名字或名字被人為修改了該怎么辦呢?
我們可以通過索引來獲取指定工作表的名字,以下方法可以用來獲取工作表名稱的數組:
ArrayList al = new ArrayList();
string strConn;
strConn = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:/test.xls;"+
"Extended Properties=Excel 8.0;";
OleDbConnection conn = new OleDbConnection(strConn);
conn.Open();
DataTable sheetNames = conn.GetOleDbSchemaTable
(OleDbSchemaGuid.Tables, new object[] { null, null, null, "TABLE" });
conn.Close();
foreach (DataRow dr in sheetNames.Rows)
{
al.Add(dr[2]);
}
return al;
IMEX=1的時候並不是全都會作為字符串來處理,根據系統的默認設置,通常如果前8行有字符串,則該列會作為字符串來處理,如果全都為數字,則該列為數字列,日期也是一樣。
如果你覺得8行不夠或者太多了,則只能修改注冊表HKEY_LOCAL_MACHINE/Software/Microsoft/Jet/4.0/Engines/Excel/TypeGuessRows,如果此值為0,則會根據所有行來判斷使用什么類型,通常不建議這麽做,除非你的數據量確實比較少。
無法讀取EXCEL中的數據單元格。有數據,但是讀出來全是空值。
解決方法:
1.在導入數據連接字符串中,將IMEX=1加入,“Provider=Microsoft.Jet.OLEDB.4.0;Data Source="C:\Data.xls";Extended Properties="Excel 8.0;HDR=Yes;IMEX=1; ”,這樣就可以。
注:
“HDR=Yes;”指示第一行中包含列名,而不是數據;
“IMEX=1;”通知驅動程
序始終將“互混”數據列作為文本讀取。
兩者必須一起使用。
本以為這樣就OK了。但在實際使用過程中,這樣設置還是不行,查閱了不少資料才發現,原來還有一個注冊表里的信息需要修改,這樣帶能讓excel不再使用前8行的內容來確定該列的類型。
注冊表修改內容如下:
在HKEY_LOCAL_MACHINE\Software\Microsoft\Jet\4.0\Engines\Excel有一個TypeGuessRows值,預設是8,表示會先讀取前8列來決定每一個欄位的型態,所以如果前8列的資料都是數字,到了第9列以后出現的文字資料都會變成null,所以如果要解決這個問題,只要把TypeGuessRows機碼值改成0,就可以解這個問題了。