百度的搜索URL存在着一定的規律和邏輯,下面的鏈接是我使用百度搜索“標點符”后得到的鏈接,下面就來一起分析下百度搜索結果URL的秘密。
http://www.baidu.com/s?wd=%E6%A0%87%E7%82%B9%E7%AC%A6&rsv_spt=1&issp=1&rsv_bp=0&ie=utf-8&tn=baiduhome_pg&inputT=2969
URL中的s?表示搜索,&符號起到參數連接符的作用。上述鏈接涉及到的參數如下:
wd:Keyword,查詢的關鍵詞,有時還會是word,比如www.cjzzc.com打開的鏈接就是word,wd后面的關鍵詞使用gb2312進行編碼,如果搜索詞中出現空格則使用+號替換;
rsv_spt:識別瀏覽器,目前測試下來Chrome、FireFox、Safari的為3,IE瀏覽器為1;
rsv_bp:判斷搜索位置:0為從百度首頁進入,1為搜索結果頂部搜索,2為搜索結果底部搜索;
ie:InputEncoding,查詢關鍵詞的編碼,缺省設置為簡體中文,即ie=gb2312;
tn:搜索框來源標識,如百度首頁的就是baiduhome_ph,hao123站來的sitehao123,遨游瀏覽器的為tn=myie2dg等。除了百度自身用來數據統計好,此數據還對百度搜索聯盟分成起到跟蹤作用。tn=baidulocal表示百度站內搜索,返回的結果很干凈,無廣告干擾;
inputT:搜索響應時間,單位是毫秒;
以上我上面的URL中出現的參數,但是百度的搜索引擎參數遠遠比上面的還要多。再來看看還有哪些參數:
bs:BeforeSearch,上一次搜索的關鍵詞;百度會記錄上一次用戶的搜索詞是什么;
sr:結合bs使用。一般查詢sr=0或者為空值,但sr=1時,查詢將結合bs的值一起作為查詢的關鍵字。默認值為0,除0,1外其它值無效。
pn:PageNumber,搜索結果的頁碼,從零開始計數。即pn=${結果頁碼-1}*rn;
rn:RecordNumber,搜索結果顯示條數,缺省設置rn=10,取值范圍:10-100
cl:Class,搜索類型,cl=3為網頁搜索,cl=2為圖片搜索;
lm:搜索結果的時間限制。以天為單位,例如搜索最近一個月的網頁,lm=30.默認值為0,表示沒有時間限制;
ct:語言限制。0-所有語言,1-簡體中文網頁,2-繁體中文網頁;其它不確定或者無效或。默認值為0;
q5:搜索內容位置限制。0-所有內容;1-網頁標題(相當於使用’title:’查詢前綴);2-url(相當於使用’inurl:’查詢前綴);其它值等效於0,默認值為0;
q6:搜索內容網站限制。例如q6=www.shangkejz.com,表示只搜索http://www.shangkejz.com/的網頁;相當於使用了’site:前綴’,默認值為空
dq:不建議使用該參數。查詢內容來源的地區限制。具體值有百度確定,默認值為空。使用這個參數的效果很差;
oq:相關搜索的主詞,例如,搜索“標點符”后點擊“標點符號”,出現的相關搜索,用來記錄來源詞“標點符”,或輸入搜索詞,輸入到一半點推薦關鍵詞的那個詞,兩個通過出現rsp/rsv_bp進行區分;
rsp:相關搜索詞的位置,第一個推薦詞為0,第二個為1,以此類推;
usm:在百度搜索任何詞從任何一頁點到第三頁以后的,都會隨機出現usm的參數。當usm=0的時候是正常排名。當usm=1的時候所有排名后移一位,當usm=2的時候排名后移兩位,以此類推。而詞參數影響排名的效果只對第三頁以及第三頁以后的有效,也就是說前20名的排名不受詞因素影響。此參數具體作用未知;
f:搜索判斷,f=8用戶自主搜索,f=3下拉框推薦,f=1相關搜索;
rsv_ers:出現的值為rsv_ers=xn0或rsv_ers=xn1,目前還不知道具體的作用。
rs_src:目前看到的都是rs_src=0,此參數與rsv_ers同時出現。
http://www.baidu.com/s?wd=關鍵字
wd(Keyword):查詢的關鍵詞;
http://www.baidu.com/s?wd=關鍵字&cl=3
cl(Class):搜索類型,cl=3為網頁搜索,cl=2為圖片搜索;
pn(PageNumber):顯示結果的頁數;
http://www.baidu.com/s?ie=gb2312
ie(InputEncoding):查詢關鍵詞的編碼,缺省設置為簡體中文,即ie=gb2312;
ct:此值一般是一串數字,可能是搜索請求的驗證碼;
si:在限定的域名中搜索,比如想在本站內搜索可使用參數si=gldadi.com,要使這個參數有效必須結合ct參數一起使用;
rn(RecordNumber):搜索結果顯示條數,缺省設置rn=10,取值范圍:10-100;
http://www.baidu.com/s?bs=今日頭條
bs(BeforeSearch):上一次搜索的關鍵詞;
tn:提交搜索請求的來源站點,這是百度與免費軟件合作時的利益來源,舉例來說我們使用的一些免費瀏覽器中所提供的百度搜索時,URL地址中都帶有tn=內容,tn=后面的內容就是百度聯盟的賬號。如:Firefox的tn=suvion_dg(tn=suvion_4_dg),傲游的tn=myie2dg,TheWorld的tn=suvion_4_pg,只要你使用了這些帶有tn=的搜索,只要點擊了其中的廣告,提供該軟件的瀏覽器就會從中賺取利益。搜索結果有個例外,當tn=baidulocal時,你可以得到一個無競價無廣告的百度搜索結果.
收集補充:
oq=上一次搜索詞(之前利用這個刷出下拉)
rq=這段時間新增加的參數,參數跟oq調用的也是上一次搜索詞
sa=ts_“?”(1代表第一個下拉詞,2代表第二個下拉詞,3代表第三個下拉詞,4代表第四個下拉詞,5代表第五個下拉詞,例:sa=ts_1 那么就是第一個下拉詞)
rsv_pq=(搜索驗證)
rsv_t=(搜索驗證)
ssid=(據說是識別路由器,反正是識別網絡或者網段之類的東西,只用利用360瀏覽器進行搜索才有這個參數)
tn=搜索框來源標識,tn=iphone是代表模擬手機設備蘋果模擬器,tn=zbios代表是蘋果下面的客戶端搜索。
q5=搜索內容位置限制.0-所有內容;1-網頁標題(相當於使用'title:'查詢前綴);2-url(相當於使用'inurl:'查詢前綴);其它值等效於0.默認值為0
q6=搜索內容網站限制.例如q6=sohu.com,表示只搜索sohu.com的網頁;相當於使用了'site:前綴'.默認值為空
dq=不建議使用該參數.查詢內容來原的地區限制.具體值有百度確定.默認值為空.試了一下,使用這個參數的效果很差.
submit=
tb=on貼吧?
f未知。默認值為空
cl未知。默認值為空
rs2未知。
sc未知。
百度搜索命令參數
構造半自動化搜索引擎查詢,需要了解一下,百度url構成方式和參數的作用。雖然是轉載,但是還是有很大的學習意義了。
http://www.baidu.com/baidu?cl=3&tn=baidutop10&wd=%B6%B9%B0%EA
這是一個從百度風雲榜里面截取的url鏈接了。cl=3表示網頁搜索,tn表示來源站點,wd是關鍵詞%B6%B9%B0%EA是utf編碼之后的結果了。
百度搜索命令中的參數
必備參數:
wd——查詢的關鍵詞(Keyword)
pn——顯示結果的頁數(PageNumber)
cl——搜索類型(Class),cl=3為網頁搜索
可選參數:
rn——搜索結果顯示條數(RecordNumber),取值范圍在10--100條之間,缺省設置rn=10
ie——查詢輸入文字的編碼(InputEncoding),缺省設置ie=gb2312,即為簡體中文
tn——提交搜索請求的來源站點
幾個有用的tn
tn=baidulocal表示百度站內搜索,返回的結果很干凈,無廣告干擾。
比如,在百度站內搜索“快樂”,看看返回結果是不是很清爽。
tn=baiducnnic想把百度放在框架中嗎?試試這個參數就可以了,是百度為Cnnic定制的
si——在限定的域名中搜索,比如想在新浪的站內搜索可使用參數si=sina.com.cn,要使這個參數有效必須結合ct參數一起使用。
ct——此參數的值一般是一串數字,估計應該是搜索請求的驗證碼
si和ct參數結合使用,比如在sina.com.cn中搜索“理想”,可用:http://www.baidu.com/s?q=&ct=2097152&si=sina.com.cn&ie=gb2312&cl=3&wd=理想
bs——上一次搜索的關鍵詞(BeforeSearch),估計與相關搜索有關
百度搜索網址參數的含義
如果你是一個細心的人在百度搜索的時候你就會發現每次搜索百度搜索網址的參數除了我們搜的關鍵詞其它參數會隨之變化.
要成為一名合格的網站優化員(自稱SEOer)了解這些參數是必須的.
舉例說明各個參數的意思:
1.瀏覽器輸入www.baidu.com打開百度首頁/輸入"老吧"搜索再看百度的附加了參數:(這里我只分析關鍵的參數)
https://www.baidu.com/s?wd=%E8%80%81%E5%90%A7
%E8%80%81%E5%90%A7部分就是我剛搜索的關鍵詞"老吧",只是中文字體經過瀏覽器的編碼變成上面的樣子,wd就是百度其中的一個參數(wd=關鍵字).
2.搜索的結果肯定不止一頁,我們點第二頁,百度搜索結果網址又多了些參數:
http://www.baidu.com/s?wd=%E8%80%81%E5%90%A7&pn=100&rn=100&ie=utf-8&usm=2
rn=100rn參數是指定每頁顯示100條結果,一般是10的倍數,最大100條/每頁;
pn=100pn參數則是當前頁碼,不過百度進行了運算,如果是第一頁pn就等於0,如果是第二頁則是(rn=100)*((pn=0)+1)這樣顯示第二頁就剛好是rn=100了.
3.如果我們這時候在當前的百度網頁輸入框中重新搜索一個詞"老修",看百度搜索結果的網址又加了參數.
http://www.baidu.com/s?rn=100&ie=utf-8&bs=%E8%80%81%E5%90%A7&f=8&rsv_bp=1&wd=%E8%80%81%E4%BF%AE&rsv_sug3=6&rsv_sug4=187&rsv_sug1=6&rsv_sug2=0&inputT=2
wd參數是我們當前搜索的"老修"關鍵詞,"bs參數"則是指BeforeSearch-上一次搜索輸入的關鍵詞
如果我們再在輸入框中再搜別的詞,百度url中的參數基本不加了.
4.還有一種情況是當我們輸入一個關鍵詞的時候百度會給我們一些下拉詞選擇,如果選擇一個關鍵詞,url參數又不一樣了:
http://www.baidu.com/s?tn=baiduhome_pg&rn=100&ie=utf-8&bs=%E8%80%81%E5%90%A7&f=3&rsv_bp=1&rsv_spt=1&wd=%E8%80%81%E6%B9%BF%E5%90%A7&rsv_sug3=1&rsv_sug4=15&rsv_sug1=1&oq=%E8%80%81%E5%90%A7&rsv_sug2=1&rsp=4&inputT=0&rsv_sug=1
選擇下拉的關鍵詞則多了個oq參數,伴隨這oq參數同時還有一個關鍵的的f=3,這兩個參數的含義引用網上的解釋:
oq參數是指原先查詢字符串(originalqueryString)
oq和關鍵詞(wd)參數值有着相同的特征,亦是自行輸入搜索詞,百度搜索框提示詞,相關搜索候選詞或者錯別字提示正確搜索詞等,長度限制在38個漢字以內。
oq參數不僅在相關搜索(f=1)中出現,另外幾種搜索形式,如即時搜索提示(f=3)、錯別字提示正確搜索(f=12)也會有oq.rsp=4表示是第四個提示詞.
百度搜索地址其它參數:
f(form)參數值:1相關搜索;3即時搜索提示;8自主搜索形式;12錯別字提示正確搜索
ct此值一般是一串數字,可能是搜索請求的驗證碼;
si在限定的域名中搜索,比如想在站內搜索可用si=gldadi.com,這個參數必須結合
ct參數一起使用;類似:site:gldadi.org
tn提交搜索請求的來源站點,這是百度與免費軟件合作時的利益來源,
ie網頁編碼比如:gb2312/GBK/UTF-8等
ct語言限制。0-所有語言,1-簡體中文網頁,2-繁體中文網頁等等;
lm搜索結果的時間限制。以天為單位
q5搜索內容位置限制.0-所有內容;1-網頁標題(相當於使用'title:'查詢前綴);2-url(相當於使用'inurl:'查詢前綴);其它值等效於0.默認值為0
q6搜索內容網站限制.例如q6=sohu.com,表示只搜索sohu.com的網頁;相當於使用了'site:前綴'.默認值為空
dq查詢內容來原的地區限制.
rs_src相關搜索_語義關聯性(relatedsearch_src)參數值:0與原先查詢字符串語義關聯性較高1與原先查詢字符串語義關聯性較低(當我們搜索的時候點百度底下提示的相關搜索就會有這個參數)
rsv_bp=0表示在百度首頁、瀏覽器的百度搜索欄、導航站等初次在搜索框輸入內容進行搜索。
rsv_bp=1表示在百度搜索結果的頁眉(header)搜索框中繼續搜索
rsv_bp=2表示在百度搜索結果的頁腳(footer)搜索框中繼續搜索,至少連續搜索過2次以上,才會出現rsv_bp=1或rsv_bp=2。
rsv_sug=0rsv_sug=1rsv_sug=2,分別表示搜索框提示0-2條搜索歷史記錄。以藍色字體和其他黑色提示詞區分開。
rsv_sug1搜索框提示次數
rsv_sug2搜索框提示詞搜索方式:0鍵盤選擇搜索框提示詞后,沒有更改過提示詞的搜索方式,1非鍵盤(如鼠標、手指等)選擇搜索框提示詞進行搜索
rsv_sug3和鍵盤重復速率有關。鍵盤重復速度或網速越快,rsv_sug3參數值越小,但不小於0;重復速度或網速越慢,rsv_sug3參數值越大,但不超過總輸入次數。鍵盤重復速度越快表明用戶大概知道自己要搜的是什么關鍵詞,但不能反過來認為速度越慢就越不清楚自己想要搜索的是什么。
rsv_sug4反饋搜索結果用時
rsv_sug5提示詞輸入搜索框方式
rsv_n其他輸入搜索詞方式:1提示詞填充到搜索框后做了修改,2粘貼搜索詞
rsv_spt首頁搜索類型:1新版百度首頁搜索(先要登錄百度帳號);2百度實時熱點搜索(先要登錄百度帳號);3傳統百度首頁搜索
rsv_ers參數是百度統計用戶翻頁行為的.
inputT輸入耗時
另外還有一個參數USM,這個參數通常出現的非第一頁搜索結果中,比如搜索一個詞打開第二頁,修改這個參數的值:分別為1/2/3,就會發現非第一頁的搜索排名發生的移動
新增參數(移動端)
word=代表手機移動搜索,wd=代表電腦PC搜索
sa=ib(首頁)
sa=tb(上方搜索輸入框)
sa=np(內頁)
SEO模擬點擊發包具體的利用方法。
市面上的快排80%以上都是模擬點擊+刷參。模擬點擊核心點需要大量的IP,這個用點擊器可以完成,市面上的點擊器很多比如流量寶、點擊精靈等。點擊器功能也非常強大了,可以構造系統環境、UA、IP、搜索入口、停留時間、COOKIE、行為軌跡、屏幕分辨率等等。
刷參主要解決是的欺騙百度的問題的,把構造好的參數返回給百度,讓百度以為我們的網站用戶體驗非常好,來提升網站整體排名。目前刷參主要的參數si、ct和et。我給我幾個鏈接你仔細看下。
正常的:https://www.baidu.com/baidu?wd=%E9%BB%91%E5%B8%BDSEO%E5%9F%B9%E8%AE%AD&tn=monline_4_dg&ie=utf-8
si和ct結合來刷的:https://www.baidu.com/baidu?wd=%E9%BB%91%E5%B8%BDSEO%E5%9F%B9%E8%AE%AD&tn=monline_4_dg&ie=utf-8&si=toutiao.com&ct=2097152
主要注意鏈接后半段,顯示正常頁面,全是我們的目標網站。
si和ct結合來刷的:https://www.baidu.com/baidu?wd=%E9%BB%91%E5%B8%BDSEO%E5%9F%B9%E8%AE%AD&tn=monline_4_dg&ie=utf-8&si=toutiao.com&ct=2097153
主要注意鏈接后半段,顯示正常頁面,全是我們的目標網站。
si和ct結合來刷的:https://www.baidu.com/baidu?wd=%E9%BB%91%E5%B8%BDSEO%E5%9F%B9%E8%AE%AD&tn=monline_4_dg&ie=utf-8&si=gldadi.com&ct=1526456
主要注意鏈接后半段,顯示不正常,沒有搜索到網站。這里只是個告訴你ct不是隨隨便便寫的。
刷et的:https://www.baidu.com/baidu?wd=%E9%BB%91%E5%B8%BDSEO%E5%9F%B9%E8%AE%AD&tn=monline_4_dg&ie=utf-8&et=gldadi.com
注意:你往后翻看幾頁發現還有不是我們的網站的網址。
目前市面上核心的刷參就是si、ct和et,再配合上面提到的一些參數,記住si、ct和et是重點,市面上80%以上的快排系統都在這幾個參數上面做文章。
那還有20%的快排呢?
像這種刷參+模擬點擊一直是有效果的,對於有些從未刷過的排名效果也非常明顯,所以有了7天上首頁的說法。但是對比起其他2種就比較菜了。
一種就是傳說中的發包。我們上述討論的都是在說瀏覽器中的百度鏈接地址,這種的請求方式都是get請求方式,發包用的POST請求方式,他的參數不會出現在瀏覽器中。就是我們去網站注冊會員的時候,你注冊的賬號密碼是不會通過get請求方式的(為了安全),用的是POST請求方式,你在瀏覽器網址中是看不到提交數據。
所以,利用發包百度統計工具統計不到IP的,因為根本就沒有模擬點擊,沒有IP進來。當然模擬點擊+刷參也可以通過一定手段讓流量統計工具統計不到IP。