淺說搜索引擎和SEO


搜索引擎
  基本工作原理
  信息收集功能
  技術點
SEO優化核心
  優化重點
  SEO優化
    網站URL
    title信息
    meta信息
    圖片ALT
    flash信息
    frame框架
  網頁重要度特征

  之前有看到一個師兄的個人博客做得很漂亮、每次打開百度后直接搜索該師兄的名字,該博客每次都排列在第一位,很神奇的事情,要知道關於SEO在很多人看來都是一門大學問。故特此簡單學習一下搜索引擎的基本知識和SEO,希望能對這方面有所了解!

搜索引擎

基本工作原理

搜索引擎的基本工作原理包括以下三個過程: 
  1、抓取網頁。每個獨立的搜索引擎都有自己的網頁抓取程序爬蟲,爬蟲通過超鏈接從一個網站爬到另外一個網站,通過超鏈接分析連續訪問抓取更多網頁,被爬取得網頁被稱為網頁快照。 
  爬蟲抓取網頁的常用策略: 
a.深度優先、b.寬度優先、c.權重優先(層次的多與少;連接的外鏈多少與質量)、d.重訪抓取(全部重訪;單個重訪) 
  2、處理網頁。抓取到了網頁后,引擎還要做大量的預處理工作,如數據分析、建立索引庫等,才能提供檢索服務。其中,最重要的就是提取關鍵詞,建立索引庫和索引。其中還包括去除重復網頁、分詞(中文)、判斷網頁類型、分析超鏈接、計算網頁的重要度和復雜度等。 
  數據處理: 
a.網頁結構化(刪除html代碼,提取內容)、b.消噪(留下網頁的主題內容)、c.查重(查找重復的頁面刪除)、d.分詞(將內容分為N個單詞,排列,存進索引庫)、e.鏈接分析(計算鏈接權重) 
  3、提供檢索服務。由檢索器根據用戶輸入的查詢關鍵字,在索引庫中快速檢出文檔,進行文檔和查詢的相關度評價,對將要輸出的結果進行排序,並將查詢結果返回給用戶。

信息收集功能

搜索引擎的自動信息收集功能分為兩種:

  • 定期搜索(如Google一般為28天,主動搜索提取網站信息和網址加入自己的數據庫)
  • 提交網站搜索(網站擁有者主動向搜索引擎提交網址,在一定時間內定向向你的網站進行搜索) 
    當用戶以關鍵字查找信息時,搜索引擎會在數據庫中進行搜尋,如果找到與用戶要求內容相符的網站,便采用特殊的算法–通常根據網頁中關鍵詞的匹配程度、出現位置、頻次,鏈接質量等,計算出個網頁的相關度和排名等級,然后根據關聯度高低,按順序將這些網頁鏈接返回給用戶。

技術點

  搜索引擎設計的技術點:技術點主要集中在處理網頁和抓取網頁部分:如查詢處理、排序算法、頁面抓取算法、CACHE機制、ANTI-SPAM等等。

SEO優化核心

  SEO:Search Engine Optimization,搜索引擎優化。簡單來說就是提高網站搜索友好度、使網站搜索排名提高。

優化重點

  1、網站的程序架構要盡量保持簡潔,去除花銷的代碼,可以嘗試JS調用。搜索引擎優化本身就與用戶體驗相通相倚,相互結合,除此之外,繁瑣的代碼不但會影響網站頁面的加載速度,讓用戶體驗降低。 
  2、做足站內SEO的細節功夫。從大范圍上講,是要對程序進行趨簡潔化的修正,而細節來說,就是在URL靜態化、title、keyword、description的寫法,keyword已經不被搜索引擎投以任何的重視。 
  3、做足站外SEO的方方面面。包括交換友情鏈接的注意和做普通外鏈時候應該如何操作、控制等,切勿想着走捷徑,想着群發外鏈或者一次性購買大量高權重外鏈。這些都是SEO的錯誤思維和策略。我們一般推薦大家做一般性傳統SEO。 
  4、用戶體驗。在搜索引擎上獲得排名的原因是因為我們為用戶提供了有價值的內容。從發展角度去看,我們都應該朝着做用戶、做產品、做服務的方面去發展。

SEO優化

網站URL

  網站創建具有良好描述性、規范、簡單的url,有利於用戶更方便的記憶和判斷網頁的內容,也有利於搜索引擎更有效的抓取你的網站。 
  處理方式:

  • 在系統中只使用正常形式URL,不讓用戶接觸到非正常形式的URL。
  • 不把session id、統計代碼等不必要的內容放進URL中。
  • 不同形式的URL,301永久跳轉到正常形式。
  • 防止用戶輸錯而啟動的備用域名,301永久跳轉到主域名。
  • 使用robots.txt禁止Baiduspider抓取您不想向用戶展示的形式。

title信息

  網頁的title用於告訴用戶和搜索引擎這個網頁的主要內容是什么,而且當用戶在百度網頁搜索中搜索到你的網頁的時候,title會作為最重要的內容顯示在摘要中。搜索引擎在判斷一個網頁內容權重時,title是主要參考信息之一。 
  描述建議

  • 首頁,網站名稱,或者網站名稱_提供服務介紹or 產品介紹
  • 頻道頁:頻道名稱_網站名稱
  • 文章頁:文章title_頻道名稱_網站名稱 
    需要注意的是 
    1、標題要主題明確,包含這個網頁中最重要的內容。 
    2、簡明精煉,不羅列與網站內容不相關的信息。 
    3、用戶瀏覽通常是從左向右的,重要的內容應該放在title的靠前的位置。 
    4、使用用戶所熟知的語言描述。

meta信息

  meta description是meta標簽的一部分,位於html的區。 
  meta description是對網頁內容的精簡概括,如果meta description描述與網頁內容相符,百度會將meta description當作摘要的選擇目標之一。雖然它不是權值計算的參考因素,這個標簽存在與否不影響網頁權值,只會用作搜索結果摘要的一個選擇目標。 
推薦做法: 
  網站首頁、頻道頁、產品參數頁等沒有大段文字可以用作摘要的網頁最合適使用description。 
  為每個網頁創建不同meta description,避免所有的頁面都使用同樣的描述。 
  長度合理,不過長不過短。

圖片ALT

  建議為圖片加alt說明,因為這樣可以讓搜索引擎了解圖片的內容。

flash信息

  Baiduspider只能讀懂文本內容,flash、圖片等非文本內容暫時不能處理,放置在flash、圖片中的文字,百度無法識別。 
  所以如果一定要使用flash,建議給object標簽添加注釋信息。 
  這些信息會被看作是對Flash的描述信息。讓搜索引擎更好的了解您flash的內容。

frame框架

  不建議使用frame和iframe框架結構,通過iframe顯示的內容可能會被百度丟棄。

網頁重要度特征

  體現網頁重要度的特征有: 
  1、網頁的入度大,表明被其他網頁引用的次數多。 
  2、某網頁的父網頁入度大。 
  3、網頁的鏡像度高,說明網頁比較熱門,從而顯得很重要。 
  4、網頁的目錄深度小,易於用戶瀏覽到。這里定義的目錄深度是指除去域名部分的目錄層次。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM