今天遇到了一個網頁時繁體的,它的title和meta信息在瀏覽器中顯示正常,但是查看其源碼是卻是“最新發”這種。
在網上找了半天資料,終於搞明白了。
以在網頁中&#開頭的是HTML實體,一些字符在 HTML 中是預留的,擁有特殊的含義,比如小於號‘<’用於定義 HTML 標簽的開始。如果我們希望瀏覽器正確地顯示這些字符,我們必須在 HTML 源碼中插入字符實體。詳情請看
http://baike.baidu.com/view/4757776.htm
如何把漢字轉換成HTML實體呢?
其實很簡單,漢字的HTML實體由三部分組成,”&#+ASCII+;“ 即可。
例如,把“最新” 轉換成“最新”
另附:ASCII編碼表在線查詢地址:
http://www.weste.net/tools/ASCII.asp
字符實體有三部分:一個和號 (&),一個實體名稱,或者 # 和一個實體編號,以及一個分號 (;)。
要在 HTML 文檔中顯示小於號,我們需要這樣寫:< 或者 <
使用實體名稱而不是實體編號的好處在於,名稱相對來說更容易記憶。而這么做的壞處是,並不是所有的瀏覽器都支持最新的實體名稱,然而幾乎所有的瀏覽器對實體編號的支持都很好。
注意:實體對大小寫敏感。
最常用的字符實體
| 顯示結果 | 描述 | 實體名稱 | 實體編號 |
|---|---|---|---|
| 空格 | |   | |
| < | 小於號 | < | < |
| > | 大於號 | > | > |
| & | 和號 | & | & |
| " | 引號 | " | " |
| ' | 撇號 | ' (IE不支持) | ' |
其他一些常用的字符實體
| 顯示結果 | 描述 | 實體名稱 | 實體編號 |
|---|---|---|---|
| ¢ | 分 | ¢ | ¢ |
| £ | 鎊 | £ | £ |
| ¥ | 日圓 | ¥ | ¥ |
| § | 節 | § | § |
| © | 版權 | © | © |
| ® | 注冊商標 | ® | ® |
| × | 乘號 | × | × |
| ÷ | 除號 | ÷ | ÷ |
