sitemap資料


功能

Sitemap 可方便管理員通知搜索引擎他們網站上有哪些可供抓取的網頁。最簡單的 Sitepmap 形式,就是 XML 文件,在其中列出網站中的網址以及關於每個網址的其他元數據(上次更新的時間、更改的頻率以及相對於網站上其他網址的重要程度為何等),以便搜索引擎可以 更加智能地抓取網站。

 

介紹

網絡抓取工具通常會通過網站內部和其他網站上的鏈接查找網頁。

  

 

Sitemap 會提供此數據以便允許支持 Sitemap 的抓取工具抓取 Sitemap 提供的所有網址,並了解使用相關元數據的網址。使用 Sitemap 協議並不能保證網頁會包含在搜索引擎中,但可向網絡抓取工具提供一些提示以便它們更有效地抓取網站。

 

作用

Sitemap 0.90 是依據創意公用授權-相同方式共享 (Attribution-ShareAlike Creative Commons License) 的條款提供的,並被廣泛采用,受 Google、Yahoo! 和 Microsoft 在內的眾多廠商的支持。

 

google sitemap 文件生成格式

<urlset xmlns=“網頁列表地址”>  

 <url>  

 <loc>網址</loc>  

 <lastmod>2005-06-03T04:20-08:00</lastmod>

  <changefreq>always</changefreq>

  <priority>1.0</priority>  

 </url>  

 <url>   

<loc>網址</loc>  

 <lastmod>2005-06-02T20:20:36Z</lastmod>

  <changefreq>daily</changefreq>  

 <priority>0.8</priority>  

 </url>  

 </urlset>

 

百度 sitemap 文件格式

<?xml version="1.0" encoding="UTF-8"?>  

 <urlset>  

 <url>

  <loc>網頁地址</loc>

  <lastmod>2010-01-01</lastmod>

  <changefreq>daily</changefreq>

  <priority>1.0</priority>  

 </url>  

 </urlset>

 

xml標簽

changefreq:頁面內容更新頻率。

lastmod:頁面最后修改時間   

loc:頁面永久鏈接地址   

priority:相對於其他頁面的優先權   

url:相對於前4個標簽的父標簽   

urlset:相對於前5個標簽的父標簽   

我將一句一句分解講解這個xml文件的每一個標簽:   

<urlset xmlns="   

這一行定義了此xml文件的命名空間,相當於網頁文件中的<html>標簽一樣的作用。   

<url>   

這是具體某一個鏈接的定義入口,你所希望展示在SiteMap文件中的每一個鏈接都要用<url>和</url>包含在里面,這是必須的。   

<loc></loc>   

用<loc>描述出具體的鏈接地址,這里需要注意的是鏈接地址中的一些特殊字符必須轉換為XML(HTML)定義的轉義字符,如下表: 字符 轉義后的字符   

HTML字符 字符編碼   

& 符號 & &amp;   

單引號 ' &apos;   

雙引號 " "   

大於 > &gt;   

小於 < &lt;   

<lastmod>2005-06-03T04:20:32-08:00</lastmod>   

<lastmod>是用來指定該鏈接的最后更新時間,這個很重要。Google的 機器人會在索引此鏈接前先和上次索引記錄的最后更新時間進行比較,如果時間一樣就會跳過不再索引。所以如果你的鏈接內容基於上次Google索引時的內容 有所改變,應該更新該時間,讓Google下次索引時會重新對該鏈接內容進行分析和提取關鍵字。這里必須用ISO 8601中指定的時間格式進行描述,格式化的時間格式如下:   

年:YYYY(2005)   

年和月:YYYY-MM(2005-06)   

年月日:YYYY-MM-DD(2005-06-04)   

年月日小時分鍾:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37+08:00)   

年月日小時分鍾秒:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37:30+08:00)   

這里需注意的是TZD,TZD指定就是本地時間區域標記,像中國就是+08:00了   

<changefreq>always</changefreq>   

用這個標簽告訴Google此鏈接可能會出現的更新頻率,比如首頁肯定就要用always(經 常),而對於很久前的鏈接或者不再更新內容的鏈接就可以用yearly(每年)。這里可以用來描述的單詞共這幾個:"always", "hourly", "daily", "weekly", "monthly", "yearly",具體含義我就不用解釋了吧,光看單詞的意思就明白了。   

<priority>1.0</priority>   

<priority>是用來指定此鏈接相對於其他鏈接的優先權比值,此值定於0.0 - 1.0之間   

還有</url>和</urlset>,這兩個就是來關閉xml標簽的,這和HTML中的</body>和</html>是一個道理

 

sitemap的在線生成

步驟:

  方法一:   

1.打開瀏覽器輸入在線生成Sitemap網站的網址   

2.在表單里面填入要生成sitemap的網頁的網址,然后點擊提交   

3.打開了生成的數據結果頁面,復制文本框里面的代碼。   

4.新建一個文本文件把代碼粘貼進去,然后另存為utf-8格式的文件,文件名為sitemap.xml,然后把這個文件上傳到自己網站的對應的根目錄下面。   

5.打開瀏覽器輸入網址 ,點擊右上角的登陸,用自己的google帳戶登陸,還沒有 Google 帳戶? 現在就創建一個帳戶 ,注冊帳戶以后然后登陸帳戶   

6.登陸成功以后,點擊進入用戶管理中心,然后點擊:網站管理員工具   

7.首先添加你的網址鏈接 ,添加成功以后,在網址的對應項后面點擊添加,打開sitemap的添加頁面,選擇下拉菜單,選擇普通網站地圖,下面出現文本表單,在空白表單后面添加sitemap.xml,然后點擊提交。   

8.好了!sitemap提交成功,等待5個小時之內google收錄你的網站!   

方法二:   

1. 到在線生成sitemap網站下載軟件:這里也是介紹制作google sitemap的,直接在搜索引擎輸入“sitemapx” ,找到個帶cn的鏈接,這網站制作網站地圖相當方便。下載軟件,運行。   

2. 運行軟件生成sitemap文件:工程還有新建那兩欄隨便寫,例如"sitemapx" "hongdex" 都行,確認后,顯示基本信息,直接默認,點擊下一步,接着點解抓取網頁。網頁抓取完直接點擊生成,接着點復制文件,選取路徑。sitemap的文件就這樣制作完成了。   

3. 通過FTP提交sitemap文件到網站根目錄:這個應該都會的了,不懂的可以直接百度搜索”如何通過ftp工具提交文件“等類似關鍵詞。   

4. 登陸Google網站管理員工具提交網站地圖sitemap文件: 前提已經有注冊google賬號跟添加了網站,控制台首頁那顯示sitemaps一欄,直接點擊,提交網站前輸入”sitemap.xml“ ,最后直接點擊提交網站。步驟完成!最后等着谷歌收錄網站頁面了。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM