rel="canonical" 和SEO

rel="canonical" 标签是 Google,雅虎,微软等搜索引擎一起推出的一个标签,它主要用来解决由于 URL 形式不同而造成的重复内容的问题。


复制内容或复制网页是指相同或十分相近的内容却有多个不同的URL。由于各种不同原因,很多网站都存在复制网页问题,对于复制网页,搜索引擎无法分辨出到底哪个网页是权威网页。


rel="canonical" 标签专门为“存在多个相似或十分相近网页时”指定其中的权威链接(authoritative|canonical URL),以解决副本内容(duplicate content)问题。

<link rel="canonical" href="authoritative | canonical URL"/>

说明

  • href可以是绝对地址或相对地址;但不能指向不同的域名,否则会被忽略;允许指向不同的子域名;
  • link rel="canonical"属性可以被传递,即A页面声明B为权威链接,B声明C为权威网页,则搜索引擎会认为C是A和B共同的首选权威版本。
  • 如果权威页指向的是一个404页,则搜索引擎仍会索引这个页的内容,并试图找到一个标准页。

rel="canonical" 可以在相当多的博客程序和CMS程序中使用,而且必须使用。


例如在WordPress博客程序中这两个URL:


  • http://www.wordpress.com/archives/firstpost.html

  • http://www.wordpress.com/archives/firstpost.html/trackback/

  • 这两个 URL 形式不同,第一个是日志 URL ,第二个是日志的 Trackback 的 URL,但是他们的内容都是相同的,都是“firstpost”这篇日志的内容。而搜索引擎是无法判断的,或者通过技术手段很难判断,这样就会造成了搜索引擎收录重复内容的问题,如果能够通过用户自己来制定,就会让搜索引擎减少很多工作,并且收录的更准确,rel="canonical" 标签就是基于这个原因推出的。

    简单说就是在网页的 html 加上这样一段代码:

    <LINK href="http://www.wordpress.com/archives/firstpost.html"rel="canonical">

    那么任何含有这个标签的网页,不管他最终的 URL 是如何,Google 等搜索引擎最终都会只收录 canonical 标签指定的那个。

    rel="canonical" 标签对于搜索引擎来说是非常有用的,它可以让搜索引擎只索引真正需要内容,还可以节约存储和数据库。rel="canonical" 标签在中文叫做 URL 范式。

    标签: google, 链接, rel, 网站

    此文章共有条评论, 人参与