PHP程序员站--PHP编程开发平台
 当前位置:主页 >> 网页制作 >> SEO >> 

百度今日起可识别带汉字的utf-8编码URL

百度今日起可识别带汉字的utf-8编码URL

来源:互联网  作者:  发布时间:2010-04-10
记得在昨天,笔者在通过CNZZ统计查看一个来自百度的新关键字时

记得在昨天,笔者在通过CNZZ统计查看一个来自百度的新关键字时,这个网站是使用WordPress制作的企业网站,其编码为UTF-8,在百度的搜索页面中其URL中的汉字显示的是乱码。这种现象在以往一直存在,网民在使用”据称最懂中文”的搜索引擎百度,看到很多奇怪的莫名其妙的字符,如星剑(starow)就曾经说过,UTF-8编码的网站,URL中的“百度”会变成”鐧惧害” ,而Google一开始也不能识别gb2312和GBK编码URL中的汉字, 不知道早些时候何时修改了。

 请看图片:

以下为引用的内容:
 

就在今天4月8日,我习惯性地site:www.wysth.com ,发现百度竟然可以识别带汉字的UTF-8编码URL,我昨天刚刚升级了一个WordPress的插件,以为是网站程序更改了,又site了我例外一个使用UTF-8编码的网站和Discuz构建的论坛,确认百度可识别带汉字的utf-8编码URL了。

请看图片:

以下为引用的内容:
site:www.lincha.com 大红袍
 

site: http://bbs.lincha.com  tag

 

网站编码和URL已经是SEO的重要因素之一。关于网站用utf-8编码还是用gbk编码或gb2312编码好,这个问题在各大CMS开发论坛及各大站长论坛的讨论颇多,大多站长普遍认为涉外网站(如外贸英文网站)使用UTF-8编码,主要针对国内访客的网站使用gbk或gb2312的编码。国内几大网站都是使用gb2312编码,就连百度,Sina,Sohu,网易163几大门户也是如此。

百度从一开始就不支持识别带汉字的utf-8编码URL,已经存在好几年的时间,为何数年不解决这个,应该不是技术问题,也许是百度为了提高用户体验满意度,也许百度根本就不曾关心过这个细微的问题,也许是在Google支持gb编码URL后跟进的, 竞争促进进步,垄断扼杀创新。


延伸阅读:
URL编码转换,escape() encodeURI() encodeURIComponent()
网页标准中的关于UTF-8编码的问题
解决phpmyadmin 乱码,支持gb2312和utf-8
Google:Unicode(UTF-8)征服ASCII 成互联网最常用编码
PHP程序编码规范标准
PHP中GBK和UTF8编码处理
网页UTF8编码开发中空白的问题(bom问题)
PHP编码转换函数mb_convert_encoding与iconv的使用说明
ANSI,Unicode,UTF-8网页编码的区别
百度站长平台内测

Tags: 百度   汉字   utf-8   编码   url    
最新文章
推荐阅读
月点击排行榜
PHP程序员站 Copyright © 2007-2010,PHPERZ.COM All Rights Reserved 粤ICP备07503606号