我爱学习网首页 | 设为首页 | 收藏本站 | 网站地图 您好,欢迎光临我爱学习网
我爱学习网

当前位置:首页 > 电脑教程 > 站群软件 >

屏蔽百度快照的方法

时间:2014-07-09 23:24 来源:我爱学习网 | 作者:我爱学习网 | 本文已影响
一、屏蔽百度快照的方法
使用百度搜索后,点击百度快照时,你会发现有些网站的快照被屏蔽了,无法浏览,提示:
“对不起,您所查看的网页不允许百度保存其快照,您可以直接访问http://www.5ixuexiwang.com/”。
原因是网页中添加了屏蔽搜索引擎快照的代码:<meta name="robots" content="noarchive">
 
以上的这段代码可以限制了所有的搜索引擎建立你的网页快照。如果我们需要仅仅屏蔽一个搜索引擎建立快照的话,就可以像如下这样去写 <meta name="Baiduspider" content="noarchive">。需要注意的是,这样的标记仅仅是禁止搜索引擎为你的网站建立快照,如果你要禁止搜索引擎索引你的这个页面的话,请参照后面的办法。
 
二、禁止搜索引擎抓取本页面。
 
      在SEO中,禁止搜索引擎抓取本页面或者是允许搜索引擎抓取本页面是经常会用到的。大家要注意,处理不好的话,可能是想让搜索引擎快照抓取的页面搜索引擎却没法抓;不想让搜索引擎抓取的页面,反而被抓取了。
 
     为了让搜索引擎禁止抓取本页面,我们一般的做法是在页面的元标记中加入如下的代码: 
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">,在这里,META NAME="ROBOTS"是泛指所有的搜索引擎的,在这里
 
我们也可以特指某个搜索引擎,例如META NAME="Googlebot"、META NAME="Baiduspide"等。content部分有四个命令:index、noindex、follow、nofollow,命令间以英文的“,”分隔。 
          INDEX命令:告诉搜索引擎抓取这个页面 
          FOLLOW命令:告诉搜索引擎可以从这个页面上找到链接,然后继续访问抓取下去。 
          NOINDEX命令:告诉搜索引擎不允许抓取这个页面 
         NOFOLLOW命令:告诉搜索引擎不允许从此页找到链接、拒绝其继续访问。
 
         根据以上的命令,我们就有了一下的四种组合:
 
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">:可以抓取本页,而且可以顺着本页继续索引别的链接 
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">:不许抓取本页,但是可以顺着本页抓取索引别的链接 
<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">:可以抓取本页,但是不许顺着本页抓取索引别的链接 
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">:不许抓取本页,也不许顺着本页抓取索引别的链接。
 
    这里需要注意的是,不可把两个对立的反义词写到一起,例如<META NAME="ROBOTS" CONTENT="INDEX,NOINDEX">
 
    或者直接同时写上两句
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">
 
       这里有一个简便的写法,如果是<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">的形式的话,可以写成:<META 
 
NAME="ROBOTS" CONTENT="ALL">
  如果是<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">的形式的话,可以写成:<META NAME="ROBOTS" CONTENT="NONE">
 
        当然,我们也可以把禁止建立快照和对于搜索引擎的命令写到一个命令元标记中。从上面的文章中我们得知,禁止建立网页快照的命令是noarchive,那么我们就可以写成如下的形式:<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW,noarchive">
 
         如果是对于单独的某个搜索引擎不允许建立快照,例如百度,我们就可以写成:
 
<META NAME=" Baiduspider" CONTENT="INDEX,FOLLOW,noarchive">
 
           如果在元标记中不屑关于蜘蛛的命令,那么默认的命令即为如下:
 
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW, archive">
 
           因此,如果我们对于这一部分把握不准的话,可以直接写上上面的这一行命令,或者是直接留空。 在SEO中,对于蜘蛛的控制是非常重要的一部分内容,所以希望各位看准确把握这部分的内容。 
如果你的网站不对搜索引擎的快照抓取有任何限制,那么在你在“<head>”与“</head>”之间,不要加以上标签就可以了。
(责任编辑:我爱学习网)

分享到: 更多