今天查看一个网页的百度快照,进去显示,对不起,您所查看的网页不允许百度保存其快照!
前几天查看网站百度快照的时候,百度提示,对不起,您所查看的网页不允许百度保存其快照,请直接打开网址。百度快照解释百度快照是搜索引擎对网页内容或者大部分文字性内容储存数据库的过程,很多服务器不稳定或者断断续续,导致打开速度非常慢,快照功能很巧妙的解决这个问题,把这个网站有价值的内容带回自己的数据库,百度快照排名属于纯自然排名情况。快照仅仅是保留的当时收录时刻的内容。根据对快照的理解,该网站应该是限制了搜索引擎对网页的访问或者爬行,robots.txt文件就有这个作用,最后在首页的顶部声明文件里面看到,
<meta name="robots" content="index,follow ,noarchive" />
一种就是限制快照:noarchive 限制了所有的搜索引擎建立网页快照。另外还有几个写法对做搜索引擎优化服务很有帮助
index 是允许搜索引擎抓取这个页面。
noindex是不允许抓取这个页面。
follow是可以从这个页面上找到链接然后继续访问抓取
nofollow是不允许从这个页面找链接继续访问。
对于以上几种方式有自己的简写方式,<META NAME="ROBOTS"CONTENT="INDEX,FOLLOW">的形式的话,可以写成:
<META NAME="ROBOTS" CONTENT="ALL">
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">的形式的话,可以写成:
<META NAME="ROBOTS" CONTENT="NONE">
还有可以对图片的抓取权限写法 disallow:.bmp$ 禁止对后缀是.bmp的图片抓取。
有效的利用这些属性有时候对网站优化也是一种优势,比如说播客或者论坛留言板等,能够防止网站权重随着垃圾链接的外流。