百度sitemap網(wǎng)站地圖協(xié)議規(guī)范說明及常見問題
Sitemap(站點(diǎn)地圖)是一種文件的統(tǒng)稱,通常Sitemap(站點(diǎn)地圖)可以是txt或者XML格式。通過Sitemap(站點(diǎn)地圖)你可以告訴搜索引擎關(guān)于你的站點(diǎn)中的網(wǎng)頁、視頻或者其他文件的相關(guān)信息,幫助搜索引擎更好的認(rèn)識(shí)和理解你的站點(diǎn)。格式正確的Sitemap(站點(diǎn)地圖)文件會(huì)幫助搜索引擎更高效地抓取你的網(wǎng)站。
百度Sitemap說明
文件地址格式為txt或xml,每個(gè)地址文件最多包含50,000個(gè)網(wǎng)址且需小于10MB。
sitemap提交工具僅對(duì)已驗(yàn)證站點(diǎn)開放使用,開發(fā)者無法提交同一主域下其他未驗(yàn)證站點(diǎn)的數(shù)據(jù)。
請(qǐng)勿提交索引型sitemap,索引型不予處理,且若存在索引型sitemap,將不允許提交新文件;請(qǐng)刪除索引型sitemap后再嘗試提交數(shù)據(jù)。
txt文本格式
在一個(gè)txt文本列明需要向百度提交的鏈接地址,將txt文本文件通過站長平臺(tái)進(jìn)行提交
- http://www.example.com/repaste/101562698_5230191316.html
- http://www.example.com/repaste/101586283_5230215075.html
- http://www.example.com/repaste/101639435_5230310576.html
需要遵循以下指南:
文本文件每行都必須有一個(gè)網(wǎng)址。網(wǎng)址中不能有換行。
不應(yīng)包含網(wǎng)址列表以外的任何信息。
您必須書寫完整的網(wǎng)址,包括 http。
每個(gè)文本文件最多可包含 50,000 個(gè)網(wǎng)址,并且應(yīng)小于10MB(10,485,760字節(jié))。如果網(wǎng)站所包含的網(wǎng)址超過 50,000 個(gè),則可將列表分割成多個(gè)文本文件,然后分別添加每個(gè)文件。
文本文件需使用 UTF-8 編碼或GBK編碼。
xml格式
xml格式提供有關(guān)您網(wǎng)站的其他信息,如上次更新日期、Sitemap文件的更新頻率等,供百度Spider參考。
標(biāo)簽名稱 | 標(biāo)簽說明 | 標(biāo)簽類型 | 標(biāo)簽限制 | 可選/必選 | 舉例 |
---|---|---|---|---|---|
urlset | |||||
url | url標(biāo)記每條信息的開始和結(jié)束 | / | / | 可選 最多出現(xiàn)50000次 | |
url | |||||
loc | 該條數(shù)據(jù)的存放地址 | 任意URL | 最小長度1個(gè)字符 最大長度256個(gè)字符 符合正則表達(dá)式(http://)(.+) | 必選 | http://www.baidu.com/ |
lastmod | 指該條數(shù)據(jù)的最新一次更新時(shí)間 | 日期或日期時(shí)間 | 格式為:YYYY-MM-DD[Thh:mm:ss],日期與時(shí)間之間使用T分隔,可以僅提供年月日部分 | 可選 | 2013-01-01 |
changefreq | 指該條數(shù)據(jù)的更新頻率 | 字符串 | 有效值為:always、hourly、daily、weekly、monthly、yearly、never | 可選 | always |
priority | 用來指定此鏈接相對(duì)于其他鏈接的優(yōu)先權(quán)比值,此值定于0.0-1.0之間 | 小數(shù) | 大于等于0.0 小于等于1.0 | 可選 | 1.0 |
XML格式舉例
<?xml version="1.0" encoding="UTF-8"?> <urlset> <!-- urlset,urlset用來標(biāo)記整個(gè)文檔的開頭,最少出現(xiàn)1次 最多出現(xiàn)1次 --> <url> <!-- url,url標(biāo)記每條信息的開始和結(jié)束,最少出現(xiàn)0次 最多出現(xiàn)50000次 --> <loc>http://www.baidu.com/</loc> <!-- loc,該條數(shù)據(jù)的存放地址,最少出現(xiàn)1次 最多出現(xiàn)1次,類型為URL地址,最小長度1個(gè)字符 最大長度256個(gè)字符 必須符合正則表達(dá)式(http://)(.+) --> <lastmod>2013-01-01</lastmod> <!-- lastmod,指該條數(shù)據(jù)的最新一次更新時(shí)間,最少出現(xiàn)0次 最多出現(xiàn)1次,類型為日期或日期時(shí)間,格式為YYYY-MM-DD的日期或者格式為YYYY-MM-DDThh:mm:ss的日期時(shí)間(請(qǐng)注意日期與時(shí)間之間以“T”分隔) --> <changefreq>always</changefreq> <!-- changefreq,指該條數(shù)據(jù)的更新頻率,最少出現(xiàn)0次 最多出現(xiàn)1次,類型為字符串,有效值為:always、hourly、daily、weekly、monthly、yearly、never --> <priority>1.0</priority> <!-- priority,用來指定此鏈接相對(duì)于其他鏈接的優(yōu)先權(quán)比值,此值定于0.0-1.0之間,最少出現(xiàn)0次 最多出現(xiàn)1次,類型為小數(shù),最小值為(包含)0.0 最大值為(包含)1.0 --> </url> </urlset>
若有多條url,按照上述格式重復(fù)之間的片斷,列明所有url地址,打包到一個(gè)xml文件,向站長平臺(tái)進(jìn)行提交。
如何提交Sitemap
第一步,將需提交的網(wǎng)頁列表制作成一個(gè)Sitemap文件,文件格式請(qǐng)閱讀百度Sitemap協(xié)議都支持哪些格式。
第二步,將Sitemap文件放置在網(wǎng)站目錄下。比如您的網(wǎng)站為example.com,您已制作了一個(gè)sitemap_example.xml的Sitemap文件,將sitemap_example.xml上傳至網(wǎng)站根目錄即example.com/sitemap_example.xml
第三步,登錄百度站長平臺(tái),確保提交Sitemap數(shù)據(jù)的網(wǎng)站已驗(yàn)證歸屬。
第四步,進(jìn)入Sitemap工具,點(diǎn)擊“添加新數(shù)據(jù)”,文件類型選擇“URL列表”,填寫抓取周期和Sitemap文件地址
最后,提交完之后,可在Sitemap列表里看到提交的Sitemap文件,如果Sitemap文件里面有新的網(wǎng)站鏈接,可以選擇文件后,點(diǎn)擊更新所選,即對(duì)更新的網(wǎng)站鏈接進(jìn)行了提交。
Sitemap常見問題
填寫的周期是什么含義?
百度Spider會(huì)參考設(shè)置周期抓取Sitemap文件,因此請(qǐng)根據(jù)Sitemap文件內(nèi)容的更新(比如增加新url)來設(shè)置。請(qǐng)注意若url不變而僅是url對(duì)應(yīng)的頁面內(nèi)容更新(比如論壇帖子頁有新回復(fù)內(nèi)容),不在此更新范圍內(nèi)。Sitemap工具不能解決頁面更新問題。
Sitemap提交后,多久能被百度處理?
Sitemap數(shù)據(jù)提交后,一般在1小時(shí)內(nèi)百度會(huì)開始處理。在以后的調(diào)度抓取中,如果您的sitemap支持etag,我們會(huì)更頻繁抓取sitemap文件,從而及時(shí)發(fā)現(xiàn)內(nèi)容更新;否則抓取的周期會(huì)比較長。
提交的Sitemap都會(huì)被百度抓取并收錄嗎?
百度對(duì)已提交的數(shù)據(jù),不保證一定會(huì)抓取及收錄所有網(wǎng)址。是否收錄與頁面質(zhì)量相關(guān)。
我可以壓縮我的 Sitemap 嗎?它們是否需要用 gzip 壓縮?
可以。請(qǐng)使用 gzip 壓縮 Sitemap。無論壓縮與否,Sitemap 應(yīng)該小于 10MB(10,485,759字節(jié))。
XML格式的 Sitemap 中,“priority”提示會(huì)影響我的網(wǎng)頁在搜索結(jié)果中的排名嗎?
不會(huì)。Sitemap 中的“priority”提示只是說明該網(wǎng)址相對(duì)于您自己網(wǎng)站上其他網(wǎng)址的重要性,并不會(huì)影響網(wǎng)頁在搜索結(jié)果中的排名。
網(wǎng)址在 Sitemap 中的位置是否會(huì)影響它的使用?
不會(huì)。網(wǎng)址在 Sitemap 中的位置并不會(huì)影響百度對(duì)它的識(shí)別或使用方式。
Sitemap中提交的url能否包含中文?
因?yàn)檗D(zhuǎn)碼問題建議最好不要包含中文。
總結(jié)
到此這篇關(guān)于百度sitemap網(wǎng)站地圖協(xié)議規(guī)范說明及常見問題的文章就介紹到這了,更多相關(guān)百度sitemap協(xié)議規(guī)范內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
SEO優(yōu)化必備.各大搜索引擎關(guān)鍵字?jǐn)?shù)據(jù)參考網(wǎng)址
SEO優(yōu)化必備.各大搜索引擎關(guān)鍵字?jǐn)?shù)據(jù)參考網(wǎng)址...2007-02-02為什么Google Adsense廣告單元點(diǎn)擊價(jià)格會(huì)下降??
為什么Google Adsense廣告單元點(diǎn)擊價(jià)格會(huì)下降??...2007-02-02從chinahtml的發(fā)展看個(gè)人網(wǎng)站發(fā)展的關(guān)鍵
從chinahtml的發(fā)展看個(gè)人網(wǎng)站發(fā)展的關(guān)鍵...2006-08-08