Robots META -电脑资料

电脑资料 时间:2019-01-01 我要投稿
【www.unjs.com - 电脑资料】

   

    Robots META标签则主要是针对一个个具体的页面,

Robots META

。和其他的META标签(如使用的语言、页面的描述、关键词等)一样,Robots META标签也是放

    在页面的<head></head>中,专门用来告诉搜索引擎ROBOTS

    如何抓取该页的内容。

    Robots META标签的写法:

    Robots META标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。

    content部分有四个指令选项:index、noindex、follow、nofollow,

    指令间以“,”分隔。

    INDEX 指令告诉搜索机器人抓取该页面;

    FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;

    Robots Meta标签的缺省值是INDEX和FOLLOW,只有inktomi除外,对于它,缺省值是INDEX,NOFOLLOW。

    这样,一共有四种组合:

    <META. NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>

    <META. NAME=”ROBOTS” CONTENT=”NOINDEX,FOLLOW”>

    <META. NAME=”ROBOTS” CONTENT=”INDEX,NOFOLLOW”>

    <META. NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>

    其中<META. NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>可以写成<META. NAME=”ROBOTS” CONTENT=”ALL”>;

    <META. NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>可以写成<META. NAME=”ROBOTS” CONTENT=”NONE”>

    目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎

    GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以限制GOOGLE是否保留网页快照,

电脑资料

Robots META》(https://www.unjs.com)。例如:<META. NAME=”googlebot” CONTENT=”index,follow,noarchive”>

最新文章