Google 的网页索引服务现在开始支持 HTTP 头中指定的 link rel="canonical"
关系声明,该语法在 IETF RFC 5988 第 5 段有叙述。站长可以通过 rel="canonical"
HTTP 头通告 HTML 文档以及其他格式内容(如 PDF 文件)的 canonical URL。
假设一家网站同时提供了白皮书的 HTML 页面与可下载的 PDF 版本,URL 分别为:
这时,站长可以在 PDF 文件被请求时通过 rel="canonical"
HTTP 头通告 Google 该 PDF 下载版的 canonical URL 就是相应的 HTML 文档;例如:
GET /white-paper.pdf HTTP/1.1 Host: www.example.com (...HTTP 请求头的其余部分...)
HTTP/1.1 200 OK Content-Type: application/pdf Link: <http://www.example.com/white-paper.html>; rel="canonical" Content-Length: 785710 (... HTTP 响应头的其余部分...)
另一种 rel="canonical"
HTTP 头有用的常见情形是:网站通过多个 URL 提供同样的文件(例如使用内容分发网络/CDN 时)而站长希望通告 Google 首选 URL。
当前 link 头元素只支持网页搜索。将来会根据站长的使用情况再进行调整。详情可查阅帮助中心的 canonicalization(“规范化”) 与 rel="canonical"
元素两篇文章。
via Google Webmaster Central Blog