服务器上的404报错指的是页面无法访问到,人无法访问,机器也无法访问。
人无法访问,我们都会及时更正,这非常直观。
机器无法访问主要指的是搜索引擎蜘蛛程序跟踪某一链接但无法抓到页面以及各种类型的文件。
对于页面和某些文件无法访问,我们可以通过网站的日志文件清晰地看到。什么页面、什么文件报了404错。
网站存在大量死链,蜘蛛程序将一一发现。报404错没有什么大不了的,问题是如果网站404错的比例过高,譬如超过5%,搜索引擎就会认为这个网站存在太多的错误,会引来大麻烦。最直接的危害是网站各个关键词检索在搜索引擎中呈降序。 根据我们的经验,最容易造成网站大量404问题的常见原因有三个,
- 网站更新改版,但某些局部板块沿用原来的模块,而原有的模块调用的文件已经被删除或转移了路径;
- 跟踪访问的各类脚码或CSS文件无效但调用代码依然存在;
- 某个目录直接删除(导致一段时间该目录的文件在被爬行时全部报404错,譬如原来的BBS被删除)。
前两种情况可以通过日志文件一一解决。对于后一种情况,我们建议网站改版时,上传覆盖现有文件,但未能覆盖到的文件仍然保留一段时间,3个月后再删除。
404报错虽是小问题,但处理不当将对搜索引擎营销产生危害,希望您能引以为戒。网站改版不仅需要注意404的问题,还有其他较多零散的问题,这里不一一赘述。