空格變成問號

本文轉載自查看原文 2020-03-06 21:09 651 SQL

全角空格導入數據庫后變成問號，是因為插入的字符的類型和字段的類型不匹配造成的。

可以修改字段類型text改為ntext。

2.在插入數據庫之前進行轉換

byte[] space = new byte[]{0xc2,0xa0};
string UTFSpace = Encoding.GetEncoding("UTF-8").GetString(space);
HtmlStr = HtmlStr.Replace(UTFSpace," ");

用 HtmlDecode（）去解碼后，“ ”不是被解碼為半角的空格（ASCII碼0x20）而是變成半角問號“?”（ASCII碼0x3F）。而且奇怪的是，只有每行前面的空格才會出問題，如果前面后面有漢字的話，空格就還是空格。但是更加奇怪的是，如果直接在HtmlDecode()的后面直接加上trim()的話，這個問號會被去掉。而正常的情況下，問號是不會被去掉的，只有空格才會被去掉。

發生這個問題的時候，我是在把解碼后的內容寫入數據庫，因此一直都以為是sqlserver與應用程序之間的字符集問題或者編碼方式問題。搞了N久，最后才發現在送進SqlServer之前，內容就已經是問號了。

查了很久，也找不到這個問題如何解決。因此，只能使用山寨解決方法了：

1、在Decode之前替換為空格。

2、在Decode之后直接加 Trim()

顯而易見的，這個不是一個好辦法：在顯示到瀏覽器的時候，空格就不見了

最近認真去查了一下這個問題，發現問題的關鍵，是編碼方式：如果使用的Encoding是UTF-8的話，就會發生這種情況。

問題的根源，在於UTF-8這種編碼里面，存在一個特殊的字符，其編碼是“0xC2 0xA0”，轉換成字符的時候，表現為一個空格，跟一般的半角空格（ASCII 0x20）一樣，唯一的不同是它的寬度不會被壓縮，因此比較多的被用於網頁排版（如首行縮進之類）。而其他的編碼方式如GB2312、Unicode之類並沒有這樣的字符，因此如果簡單地進行編碼轉換，生成地GB2312/Unocode字符串中，這個字符就會被替換成為問號（ASCII ox3F）。此時如果進行寫庫、寫文件之類，就會把問號直接寫入了。當然此時會有一種山寨方式：直接替換問號為空格。可是這種方法，會把原本真正的問號也槍斃掉。

使用UTF-8進行HTMLDecode的時候，對於語句開頭的（），就會被自動轉換成為這個特殊的空格，可能是判斷為放在開頭的空格，一定是用來排版的。在轉換為其他編碼之前，這個特殊的空格受到的待遇與普通的半角空格是一致的，甚至也會被trim()去掉。

因此，碰到這個問題的原因有兩種：一種是在UTF-8編碼下進行了轉換，產生了這個字符；還有一種就是網頁中直接采用了這個字符進行排版。

知道了具體原因，就有正規的解決方法了。方法就是：在得到UTF-8字符串之后，先進行一個替換，把這個特殊的空格替換為普通的空格，如果是HTML串，建議替換為（）。C#代碼如下：

byte[] space = new byte[]{0xc2,0xa0};
string UTFSpace = Encoding.GetEncoding("UTF-8").GetString(space);
HtmlStr = HtmlStr.Replace(UTFSpace," ");
這樣做，就不會把串里面本來應該有的問號錯誤的替換為空格。也不會看到討厭的問號，能保存原來字符串的真面目了。
需要強調的是，替換之前不能進行編碼轉換，一定要繼續使用UTF-8編碼。如果已經轉換成其他編碼，那么錯誤就已經不可逆轉了。沒有辦法再區分這個錯誤的問號和正常的問號之間的差別了。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【轉】空格變成問號的怪問題【轉】空格變成問號的怪問題 sql 存儲時"空格"轉成問號，且這個空格不是真的空格 ubuntu wifi變成問號網速很慢數據庫插入中文變成問號 sql 存儲時空格轉成問號問題 JSP頁面中漢語變成問號的解決辦法 Java插入中文到數據庫中文變成問號解決 Java 數據庫中文變成問號???解決辦法 ajax 請求后台返回的中文變成問號的問題