很少人会注意到自己的网页编码。
如果您的网页是中文内容,编码是GB2312,对于中国人浏览没有任何问题。我们用的是中文操作系统,IE也是中文的IE。
可是,如果您的网站存在多语种,中文首页进入后向访问者提示还有英文版、日文版、法语版。。。这种情况随处可见。您域名下的首页编码还是GB2312吗?
如果是,您的首页编码存在着大问题!
您网络推广是您的域名。一个老外访问您的网站就会发生令他莫名的事情,他/她的电脑上会提示要求安装GB2312字符!老外会这样做吗?显然不会。您首页呈现出来的一堆乱码。
因此,如果您网站中有中文内容,同时有其他语种的版本,那么您的首页(域名下默认的页面)必须做成国际通用的UTF-8。这样,老外才能看到不是乱码的中文字,虽然他/她看不懂,但不会出现上面提到的要求安装中文字库的现象。
您的网页注明了UTF-8或ISO编码,问题就解决了呢?问题还没这么简单。通常情况下访问者浏览是正常的。因为我们的IE的默认方式是自动识别编码。可是还会有一些浏览用户将将IE设置成中文的GB2312。如果您的网页编码是UTF-8,但文件并不是真正的UTF-8,浏览时就会发生一片空白现象。点击右键,将IE编码变换成UTF-8,网页内容即刻显现。
您是否有过这样的经历,看到一个网页是一片空白?很少会发生这样的事情。我们曾经看到过一个BBS门户站点的首页发生过这样真实的事情。
这真是一个很少见但又非常奇怪的现象。
这种情况通常发生在您原来网页是GB2312,您用网页编辑器将网页编码设置成UTF-8,再粘贴HTML源码。网页编码变成了UTF-8,但文件自身并没有变成真正的UTF-8。
说来您肯能不信,您用其他网页编辑器(譬如AltraEdit)打开网页查看2进制情况,您会发现真正文件头部的编码不一定与真正的纯UTF-8文件相同,这里存在着细微的差异。
非常细小的问题却隐藏着大问题。我们写出来与您分享。