自動外鏈工具 在線排版工具 搜索引擎提交入口 wordpress主題推薦 批量打開網址工具 【老域名購買】 思享SEO導航 【網站合作】

百度XML地圖規范的格式是怎樣的

1281
文章目錄
  1. 百度Sitemap支持哪些格式
  2. 創建Sitemap時有哪些注意事項?
  3. 什么是移動Sitemap協議,如何提交移動Sitemap協議
  4. URL列表—XML格式及規范說明:

百度Sitemap支持哪些格式

百度Sitemap協議支持三種格式:文本格式、xml格式、Sitemap索引格式,可以根據自己情況來選擇任意一種格式組織sitemap。具體格式說明及示例如下:

txt文本格式

在一個txt文本列明需要向百度提交的鏈接地址,將txt文本文件通過站長平臺進行提交

  • http://www.example.com/repaste/101562698_5230191316.html
  • http://www.example.com/repaste/101586283_5230215075.html
  • http://www.example.com/repaste/101639435_5230310576.html

此文本文件需要遵循以下指南:

  1. 文本文件每行都必須有一個網址。網址中不能有換行。
  2. 不應包含網址列表以外的任何信息。
  3. 您必須書寫完整的網址,包括 http。
  4. 每個文本文件最多可包含 50,000 個網址,并且應小于10MB(10,485,760字節)。如果網站所包含的網址超過 50,000 個,則可將列表分割成多個文本文件,然后分別添加每個文件。
  5. 文本文件需使用 UTF-8 編碼或GBK編碼。

xml格式

單個xml數據格式如下:

  1. <?xml?version="1.0"?encoding="utf-8"?>
  2. <!--?XML文件需以utf-8編碼-->
  3. <urlset>
  4. <!--必填標簽-->
  5. ????<url>
  6. ????????<!--必填標簽,這是具體某一個鏈接的定義入口,每一條數據都要用<url>和</url>包含在里面,這是必須的?-->
  7. ????????<loc>http://http://www.nhkkdh.live/sitemap.html</loc>
  8. ????????<!--必填,URL鏈接地址,長度不得超過256字節-->
  9. ????????<lastmod>2009-12-14</lastmod>
  10. ????????<!--可以不提交該標簽,用來指定該鏈接的最后更新時間-->
  11. ????????<changefreq>daily</changefreq>
  12. ????????<!--可以不提交該標簽,用這個標簽告訴此鏈接可能會出現的更新頻率?-->
  13. ????????<priority>0.8</priority>
  14. ????????<!--可以不提交該標簽,用來指定此鏈接相對于其他鏈接的優先權比值,此值定于0.0-1.0之間-->
  15. ????</url>
  16. ????<url>
  17. ????????<loc>http://http://www.nhkkdh.live/blog/476/</loc>
  18. ????????<lastmod>2010-05-01</lastmod>
  19. ????????<changefreq>daily</changefreq>
  20. ????????<priority>0.8</priority>
  21. ????</url>
  22. </urlset>?

上述Sitemap向百度提交了一個url:http://www.nhkkdh.live/sitemap.html

若有多條url,按照上述格式重復之間的片斷,列明所有url地址,打包到一個xml文件,向站長平臺進行提交。

Sitemap索引格式

如需提交大量sitemap文件,則可將其列在sitemap索引文件中,然后將該索引文件提交。您無需分別提交每個文件。

  1. <?xml?version="1.0"?encoding="utf-8"?>
  2. <!--?XML文件需以utf-8編碼-->
  3. <sitemapindex>
  4. <!--必填,以?<sitemapindex>?開始標記作為開始,以?</sitemapindex>?結束標記作為結束-->
  5. ????<sitemap>
  6. ????????<!--必填,以<sitemap>標簽提交一個子sitemap文件-->
  7. ????????????????????<loc>http://example.com/ext/xmlsitemap/add/201201/index_20120106.xml</loc>
  8. ????????<!--必填,識別sitemap的位置-->
  9. ????????<lastmod>2009-12-14</lastmod>
  10. ????????<!--選填,識別相對sitemap文件的修改時間-->
  11. ????</sitemap>
  12. ????<!--必填,標簽閉合-->
  13. </sitemapindex>
  14. <!--必填,標簽閉合-->?

有多個Sitemap,按上述格式重復之間的片斷,列明所有Sitemap地址,向站長平臺進行提交。

創建Sitemap時有哪些注意事項?

第一,一個Sitemap文件包含的網址不得超過 5 萬個,且文件大小不得超過 10 MB。如果您的Sitemap超過了這些限值,請將其拆分為幾個小的Sitemap。這些限制條件有助于確保您的網絡服務器不會因提供大文件而超載。

第二,一個站點支持提交的sitemap文件個數必須小于5萬個,多于5萬個后會不再處理,并顯示“鏈接數超”的提示。

第三,如果驗證了網站的主域,那么Sitemap文件中可包含該網站主域下的所有網址。

如何提交Sitemap

第一步,將需提交的網頁列表制作成一個Sitemap文件,文件格式請閱讀百度Sitemap協議都支持哪些格式。

第二步,將Sitemap文件放置在網站目錄下。比如您的網站為example.com,您已制作了一個sitemap_example.xml的Sitemap文件,將sitemap_example.xml上傳至網站根目錄即example.com/sitemap_example.xml

第三步,登錄百度站長平臺,確保提交Sitemap數據的網站已驗證歸屬。

第四步,進入Sitemap工具,點擊“添加新數據”,文件類型選擇“URL列表”,填寫抓取周期和Sitemap文件地址

最后,提交完之后,可在Sitemap列表里看到提交的Sitemap文件,如果Sitemap文件里面有新的網站鏈接,可以選擇文件后,點擊更新所選,即對更新的網站鏈接進行了提交。

什么是移動Sitemap協議,如何提交移動Sitemap協議

百度推出了移動Sitemap協議,用于將網址提交給移動搜索收錄。百度移動Sitemap協議是在標準Sitemap協議基礎上制定的,增加了標簽,它有四種取值:

  1. <mobile:mobile/>?:移動網頁
  2. <mobile:mobile?type="mobile"/>?:移動網頁
  3. <mobile:mobile?type="pc,mobile"/>:自適應網頁
  4. <mobile:mobile?type="htmladapt"/>:代碼適配?

無該上述標簽表示為PC網頁

下方樣例相當于向百度移動搜索提交了一個移動網頁:http://m.example.com/index.html,向PC搜索提交了一個傳統網頁:http://www.example.com/index.html,同時向移動搜索和PC搜索提交了一個自適配網頁http://www.example.com/autoadapt.html:

  1. <?xml?version="1.0"?encoding="UTF-8"??>
  2. <urlset?xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  3. xmlns:mobile="http://www.baidu.com/schemas/sitemap-mobile/1/">
  4. <url>
  5. <loc>http://m.example.com/index.html</loc>
  6. <mobile:mobile?type="mobile"/>
  7. <lastmod>2009-12-14</lastmod>
  8. <changefreq>daily</changefreq>
  9. <priority>0.8</priority>
  10. </url>
  11. <url>
  12. <loc>http://www.example.com/index.html</loc>
  13. <lastmod>2009-12-14</lastmod>
  14. <changefreq>daily</changefreq>
  15. <priority>0.8</priority>
  16. </url>
  17. <url>
  18. <loc>http://www.example.com/autoadapt.html</loc>
  19. <mobile:mobile?type="pc,mobile"/>
  20. <lastmod>2009-12-14</lastmod>
  21. <changefreq>daily</changefreq>
  22. <priority>0.8</priority>
  23. </url>
  24. <url>
  25. <loc>http://www.example.com/htmladapt.html</loc>
  26. <mobile:mobile?type="htmladapt"/>
  27. <lastmod>2009-12-14</lastmod>
  28. <changefreq>daily</changefreq>
  29. <priority>0.8</priority>
  30. </url>
  31. </urlset>?

按照移動Sitemap協議做好Sitemap后,在Sitemap工具點擊添加新數據提交,與提交普通Sitemap方式一致。

我提交時填寫的周期是什么含義?

百度Spider會參考設置周期抓取Sitemap文件,因此請根據Sitemap文件內容的更新(比如增加新url)來設置。請注意若url不變而僅是url對應的頁面內容更新(比如論壇帖子頁有新回復內容),不在此更新范圍內。Sitemap工具不能解決頁面更新問題。

Sitemap提交后,多久能被百度處理?

Sitemap數據提交后,一般在1小時內百度會開始處理。在以后的調度抓取中,如果您的sitemap支持etag,我們會更頻繁抓取sitemap文件,從而及時發現內容更新;否則抓取的周期會比較長。

提交的Sitemap都會被百度抓取并收錄嗎?

百度對已提交的數據,不保證一定會抓取及收錄所有網址。是否收錄與頁面質量相關。

我可以壓縮我的 Sitemap 嗎?它們是否需要用 gzip 壓縮?

可以。請使用 gzip 壓縮 Sitemap。無論壓縮與否,Sitemap 應該小于 10MB(10,485,759字節)。

XML格式的 Sitemap 中,“priority”提示會影響我的網頁在搜索結果中的排名嗎?

不會。Sitemap 中的“priority”提示只是說明該網址相對于您自己網站上其他網址的重要性,并不會影響網頁在搜索結果中的排名。

網址在 Sitemap 中的位置是否會影響它的使用?

不會。網址在 Sitemap 中的位置并不會影響百度對它的識別或使用方式。

Sitemap中提交的url能否包含中文?

因為轉碼問題建議最好不要包含中文。

URL列表—XML格式及規范說明:

標簽名稱 標簽說明 標簽類型 標簽限制 可選/必選 舉例
urlset
url url標記每條信息的開始和結束 / / 可選
最多出現50000次
url
loc 該條數據的存放地址 任意URL 最小長度1個字符
最大長度256個字符
符合正則表達式(http://)(.+)
必選 http://www.baidu.com/
lastmod 指該條數據的最新一次更新時間 日期或日期時間 格式為:YYYY-MM-DD[Thh:mm:ss],
日期與時間之間使用T分隔,可以僅提供年月日部分
可選 2013-01-01
changefreq 指該條數據的更新頻率 字符串 有效值為:
always、hourly、daily、weekly、monthly、yearly、never
可選 always
priority 用來指定此鏈接相對于其他鏈接的優先權比值,此值定于0.0-1.0之間 小數 大于等于0.0
小于等于1.0
可選 1.0

XML格式舉例

  1. <?xml?version="1.0"?encoding="UTF-8"?>
  2. <urlset>
  3. <!--?urlset,urlset用來標記整個文檔的開頭,最少出現1次?最多出現1次?-->
  4. ????<url>
  5. ????<!--?url,url標記每條信息的開始和結束,最少出現0次?最多出現50000次?-->
  6. ????????<loc>http://www.baidu.com/</loc>
  7. ????????<!--?loc,該條數據的存放地址,最少出現1次?最多出現1次,類型為URL地址,最小長度1個字符?最大長度256個字符?必須符合正則表達式(http://)(.+)?-->
  8. ????????<lastmod>2013-01-01</lastmod>
  9. ????????<!--?lastmod,指該條數據的最新一次更新時間,最少出現0次?最多出現1次,類型為日期或日期時間,格式為YYYY-MM-DD的日期或者格式為YYYY-MM-DDThh:mm:ss的日期時間(請注意日期與時間之間以“T”分隔)?-->
  10. ????????<changefreq>always</changefreq>
  11. ????????<!--?changefreq,指該條數據的更新頻率,最少出現0次?最多出現1次,類型為字符串,有效值為:always、hourly、daily、weekly、monthly、yearly、never?-->
  12. ????????<priority>1.0</priority>
  13. ????????<!--?priority,用來指定此鏈接相對于其他鏈接的優先權比值,此值定于0.0-1.0之間,最少出現0次?最多出現1次,類型為小數,最小值為(包含)0.0?最大值為(包含)1.0?-->
  14. ????</url>
  15. </urlset>

摘自:http://zhanzhang.baidu.com/site/format

全文轉載自:《百度地圖XML格式及規范說明全攻略

來源:本文由思享SEO博客原創撰寫,歡迎分享本文,轉載請保留出處和鏈接!
seo培訓評論廣告

搶沙發

昵稱*

郵箱*

網址

七乐彩选号技巧