首先,百度在官方的聲明中說:[喝小酒的網摘]http://blog.hehehehehe.cn/a/17112.htm
百度僅作為中立的轉碼工具及相關技術的提供方。在轉碼過程中,百度對第三方網站內容不做任何修改或編輯,亦不對本頁面內容負責。您享有是否閱讀轉碼頁面的選擇權,如您希望選擇以非轉碼形式查看該頁面內容,請您直接訪問原網站。
當然也有百度對於推出百度轉碼的意義以及策略,最后當然也提到了如何屏蔽百度轉碼或者說叫做不希望被轉碼方法。如果只想拿來就用,就不需要看后面的了,直接在head中間插入<meta http-equiv="Cache-Control" content="no-transform " />即可。
1. web頁面轉碼的意義?
互聯網上融合了WEB和WAP兩類網頁資源,WEB網頁資源占比遠多於WAP網頁,但目前絕大多數移動終端的瀏覽器都不能直接瀏覽WEB網頁。因此,為確保WAP可用性,必須對WAP搜索結果中的WEB網頁進行格式轉換,轉換為WAP網頁,使其能在移動終端瀏覽器被瀏覽。百度的轉碼技術即是為實現此目的、服務於WAP搜索的附屬產品,各大搜索引擎均擁有並提供類似轉碼技術。
2. 百度轉碼的策略?
為了最大程度解決WEB頁面在手機上的可用性,轉碼須去除WEB頁面中不能在手機瀏覽器上瀏覽的內容,和無法用WAP描述語言描述的部分內容,並將網頁布局由2維布局適配為1維布局。
3. 站長小貼士
(1)如果覺得自己的站點轉碼效果不佳怎么辦?
可以使用百度移動標注協議,在PC站點的html頁面中加入百度的標注協議(注釋形式),提升轉碼效果。該協議主要針對采用html規范制作的Web站點,以利於站長自助優化百度無線搜索訪問其站點時的頁面效果。
(2)如果不希望自己的站點被轉碼怎么辦?
共有三種解決方案:
A. no-transform協議
TC支持的no-transform協議為如下兩種形式:
a. HTTP Response中顯式聲明Cache-control為no-transform。
b. meta標簽中顯式聲明Cache-control為no-tranform,格式為:
<head>
<meta http-equiv="Cache-Control" content="no-transform " />
</head>
如第三方站點不希望頁面被轉碼,可添加此協議,當用戶進入第三方網站時,先進入中間提示頁,頁面將引導用戶自主選擇跳轉至原網頁。
B. handheld協議
頁面通過lt;link>標簽顯式指定WAP網頁,聲明格式如下:
<link rel="alternate" type="application/vnd.wap.xhtml+xml" media="handheld" href="target"/>
如第三方站點不希望頁面被轉碼,可添加此協議,告知我們原網頁對應有一個WAP版頁面,當用戶進入第三方網站時,先進入中間提示頁,讓用戶自主選擇跳轉至原網頁或第三方網站自有的wap頁面。
C. User-Agent相關
TC抓取頁面時,使用的User-Agent為:
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; baidu Transcoder;)
如第三方站點不希望轉碼HTML頁面,且又可以提供對應的自有WAP頁面,則可以根據這個User-Agent,返回自有WAP頁,同時在HTTP Response顯示聲明:Content-Type為:vnd.wap.xhtml+xml,那么TC將不對這個頁面轉碼,而是直接跳轉至相應的自有WAP頁面。

[喝小酒的網摘]http://blog.hehehehehe.cn/a/17112.htm