搜索引擎的工作原理


真題題目:《搜索引擎的工作原理》
真題出處:2019 年下
內容:
搜索引擎的工作原理
搜索引擎不能真正實時地在因特網上捜索信息,而是搜索預先整理好的網頁索引數據庫。它
不能真正理解網頁上的內容, 只能機械的匹配網頁上的文字。
真正意文上的搜索引擎,通常指收集了因特網上幾千萬乃至幾十億個網頁並對網頁中的每一
個詞(搜索的關鍵詞)進行索引。建立索引數據庫的全文搜索引擎。當用戶輸入某個關鍵詞進
行檢索時,所有頁面內容中包含了該關鍵詞的網頁都被作為搜索結果進行處理。在經過一些
算法進行排序后,搜索到的結果最終按照與搜索關鍵詞相關程度的高低依次排列出來。
搜索引擎的整個工作過程可以簡單的理解為三步:一是從互聯網上抓取網頁,二是建立索引
數據庫,三是在索引數據庫中對搜索結果進行排序,如圖所示。
(1)從因特網上抓取網頁
搜索引擎利用能夠從因特網上自動收集網頁的“蜘蛛”(Spider)系統程序,自動訪問因特網,
沿着網頁中的所有鏈接“爬”到其他網頁,重復這一過程,並把所有“爬”過的網頁收集過
來。
(2)建立索引數據庫
分析索引程序對收集回來的網頁進行分析,提取相關網頁信息,包括網頁的 URL,編碼類型,
頁面內容包含的所有關鍵詞,關鍵詞的位置、生成時間、大小、與其他網頁的鏈接關系等,
根據一定的相關度算法進行大量復雜計算,得到每一個網頁針對頁面文字及鏈接中每一個關
鍵詞的相關程度(或重要性),然后用這些相關信息建立網頁索引數據庫。
(3)在索引數據庫中對搜索結果進行排序
當用戶輸人關鍵詞搜索后,搜索系統程序就從網頁索引數據庫中查找與該關鍵詞相匹配的所
有網頁。然后根據這些網頁與關鍵詞的相關程度,對搜索到的數值進行排序。一般來講,相
關程度越高,排的次序越靠前。
一、三維目標
知識與技能:了解搜索引擎的工作原理;了解搜索引擎的工作過程;能夠使用圖示將搜索引擎的工作過程畫出來;
過程與方法:
情感態度價值觀:
 
二、重難點
重點:了解搜索引擎的工作原理;了解搜索引擎的工作過程;
難點:能夠使用圖示將搜索引擎的工作過程畫出來;
 
三、教學環節
(導入)
在之前的課堂中,我們學習了搜索引擎的相關知識。現在老師帶領同學們復習一下。
如果老師想要去山東旅游,想上網找一找山東的旅游景點和特產,老師應該使用哪種搜索引擎進行搜索呢?
嗯,非常好,老師可以使用全文搜索引擎。
那么老師想要找今天每一場nba比賽的賽果,老師應該使用哪一種搜索引擎進行搜索呢?
沒錯,使用目錄搜索引擎,比如新浪、搜狐等
那么還有一種搜索引擎能夠將多個搜索引擎的搜索結果進行匯總,它叫什么名字?
非常好,就是我們的元搜索引擎。
同學們回答的都非常迅速並且准確,那么搜索引擎的工作原理是什么呢?它是如何將搜索結果返回給用戶的?今天就讓我們學習《搜索引擎的工作原理》這堂課,來找一找這些問題的答案吧!
 
(新授)
首先,老是想問同學們一個問題,搜索引擎是實時的在因特網上搜索信息嗎?

有同學點頭了,也有同學不同意。同學們請觀看一段視頻,告訴老師正確的答案。

同學們心中有答案了嗎?

這位同學說,搜索引擎不是實時地在因特網上搜索信息的,而是將搜索結果預先放進網頁的索引數據庫中,當我們用戶輸入想要查找的內容時,搜索引擎就會去數據庫搜索匹配搜索內容的結果。非常好,請坐。

其實,真正意義上的搜索引擎,通常指收集了因特網上幾千萬乃至幾十億個網頁並對網頁中的每一個詞進行索引。建立索引數據庫的全文搜索引擎。當用戶輸入某個關鍵詞進行檢索時,所有網頁內容中包含了該關鍵詞的網頁都被作為搜索結果進行處理。在經過一些算法進行排序后,搜索到的結果最終按照與搜索關鍵詞相關程度的高低依次排列出來。同學們聽懂了嗎?

看到有的同學還對這個知識點不太明白,老師再總結一下,簡單來說,搜索引擎的工作過程能夠分為三步:

第一步,從互聯網上抓取網頁。

第二步,建立索引數據庫。

第三步,在索引數據庫中對搜索結果進行排序。

現在請同學們自行閱讀書本,想一想在這三個步驟中,搜索引擎它具體做了什么呢?

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM