文/玄魂
谷歌網頁搜索技術,大部分在百度等搜索引擎中也適用。同樣,這些搜索技術是來源於傳統數據庫檢索技術,因而,對這部分的學習,能為后續章節的數據庫檢索奠定基礎,並能獲得直觀的認識。本部分結合應用實例的講解也能讓我們加深信息檢索對解決實際問題、提高搜索效率的認知。
歡迎訪問玄魂的博客
同許多搜索引擎一樣,當直接在搜索框中輸入搜索詞時,谷歌默認進行模糊搜索,並能對長短語或語句進行自動拆分成小的詞進行搜索。
示例:
kali linux 滲透測試
1.2 短語精確搜索
給關鍵詞加上半角引號實現精確搜索,不進行分詞。
示例:"kali linux web滲透測試"
1.3通配符
谷歌的通配符是星號“*”,必須在精確搜索符雙引號內部使用。用通配符代替關鍵詞或短語中無法確定的字詞。
示例:"kali * web滲透測試"
1.4 點號匹配任意字符
與通配符星號“*”不一樣的是,點號“.”匹配的是字符,不是字、短語等內容。保留的字符有[、(、-等。
示例:
1.5 布爾邏輯
布爾邏輯是許多檢索系統的基本檢索技術,在搜索引擎中也一樣適用,在谷歌網頁搜索中需要注意的是:谷歌和許多搜索引擎一樣,多個詞間的邏輯關系默認的是邏輯與(空格)。當用邏輯算符的時候,詞與邏輯算符之間用需要空格分隔,包括后面講的各種語法,均要有空格。邏輯非是特例,即減號必須與對應的詞連在一起。對於復雜的邏輯關系,可用括號分組。
邏輯與
示例:滲透測試玄魂的博客
示例:滲透測試 AND 玄魂的博客
邏輯或
示例:"玄魂的博客" (kali | node)
上圖顯示的結果為搜索結果中必須包含“玄魂的博客”同時包含“kali”或者“node”的網頁。
邏輯非
示例:"玄魂的博客" -kali
上圖中顯示結果為包含“玄魂的博客”同時不包含“kali”的網頁內容。
1.6約束條件
加號“+”用於強制搜索,即必須包含加號后的內容。一般與精確搜索符一起應用。
示例:"玄魂的博客" +"愚蠢的人類"
1.7 數字范圍
用兩個點號“..”表示一個數字范圍。一般應用於日期、貨幣、尺寸、重量、高度等范圍的搜索。用作范圍時最好給一定的含義。
示例:kali linux 2010年..2014年
1.8 括號分組
邏輯組配時分組,避免邏輯混亂。括號“()”是分組符號。
示例:見上文 1.5節。
2.1 標題中搜索
通常標題是內容的高度概括,在標題中搜索的結果准確率會更高。谷歌搜索中限定搜索網頁或文檔標題的語法是:intitle或allintitle。allintitle是intitle的變體,相當於在各個搜索詞前加上intitle。二者差別不明顯,我們一般直接用intitle。
示例:intitle:"WSO 2.4" [ Sec. Info ], [ Files ], [ Console ], [ Sql ], [ Php ], [ Safe mode ], [ String tools ], [ Bruteforce ], [ Network ], [ Self remove ]
上圖 為使用intitle屬性查找網站上被黑客上傳的WSO后門網頁。打開個別網頁可以發現webshell。
2.2 正文中搜索
僅僅在網頁或文檔的正文部分搜索。谷歌搜索中限定搜索網頁或文檔正文的語法是:intext或allintext。
示例:intitle:"index" intext:"Login to the Administrative Interface"
此示例結合intitle和intext尋找Web2Py的管理后台。
打開一個鏈接。
2.3網址中搜索
谷歌搜索中限定搜索網址的語法是:inurl。是In-系指令中最強大的一個,換句話說,這個高級指令能夠直接從網站的URL入手挖掘信息,只要略微了解普通網站的URL格式,就可以極具針對性地找到你所需要的資源--甚至隱藏內容。網站構建者通常將某一類信息集中在一個網站的目錄中,所以搜索URL中的詞本身就是對某一方面內容的一個限定。如果在加上一定的詞進行組配,搜索結果將更貼近需求。
示例:inurl:phpmyadmin/index.php & (intext:username & password & "Welcome to")
該示例通過url中的特征路徑和頁面的中的特殊文本,尋找安裝有phpmyadmin的站點的對應管理入口。
打開其中的一個鏈接,如下:
2.4 錨鏈鏈接搜索
在做網站中有時候用錨點來鏈接一個頁面中的其它部分內容,這樣方便瀏覽和定位。也就是說錨點鏈接的內容通常是網頁內容中重要的章節或內容的開始部分,因而對它們的搜索也更能反映網頁的主題內容,提高搜索結果的准確度。對於熟悉網頁制作的人來說,可以從網頁源代碼中查看有錨點的HTML代碼
谷歌網頁搜索在錨鏈鏈接中語法是:inanchor或allinanchor。搜索范圍限制在頁面的鏈接錨點描述文本進行搜索。
示例:inanchor:修改密碼
2.5 文檔類型限定
谷歌網頁搜索不僅僅能搜索網頁,還能搜索各種文檔,通過文檔類型限定只對文檔進行搜索,從而不顯示頁面的內容。語法是:filetype。這個語法非常有用,我們在網上常常要找一些范文或參考資料的時候常用這個語法。filetype是根據文件后綴搜索特定文件類型,比如支持的文檔有:pdf、ppt、doc、xls等;網頁文件:htm、asp、php等。
示例:filetype:sql site:com and "insert into" admin "2014"
本示例通過filetype 查找sql文件,並且希望得到的結果為插入admin用戶的腳本。搜索結果如下:
打開其中的一個鏈接,我們可以看到sql的內容。
3.1搜索谷歌緩存的頁面(快照信息)
用cache語法的一般情況是:當一個鏈接無法訪問時(或信息被屏蔽時);當信息已經被修改,想看以前的信息時。
示例:cache:www.xuanhun521.com
3.2 相關網址
related語法對於發現某一類信息非常有用,比如當你用related搜索一個圖書館網址的時候會出來大量圖書館的網站,如【related:lib.nit.net.cn】;當搜索某期刊網址的時候,能搜索出大量給學科領域的相關期刊,如【related:www.lis.ac.cn】。
示例:related:www.kali.org
3.3 link
搜索所有鏈接到某個特定URL上的頁面.
例如,想搜索所有鏈接www.xuanhun521.com的頁面,但要排除本站網頁。
示例:link:www.xuanhun521.com -site:www.xuanhun521.com
3.4 site
搜索范圍限制在某網站或頂級域名中。
示例:site:www.xuanhun521.com
4.1 混合搜索范例
第一個示例,我們通過下面的查詢語句,查找可以未經授權就可以訪問的phpMyAdmin的后台頁面。
inurl:.php? intext:CHARACTER_SETS,COLLATIONS, ?intitle:phpmyadmin
尋找一個頁面,點開看看:
第二個示例,我們搜索可能存在openssl心臟出血漏洞的站點。
這個搜索可謂一舉多得,因為apache暴露ssl版本的頁面一般是可枚舉的目錄頁面,在這樣的頁面中我們可以探究網站的組織目錄。
原文鏈接:http://www.xuanhun521.com/Blog/2014/8/13/google-hack-%E4%B9%8B-%E6%9F%A5%E8%AF%A2%E8%AF%AD%E6%B3%95
ps:對此文章感興趣的讀者,可以加qq群:Hacking:303242737;Hacking-2群:147098303;Hacking-3群:31371755;hacking-4群:201891680;Hacking-5群:316885176