导航: 首页 >> 建站知识

百度搜索结果无法打开网站的处理方法

文章关键字:抓取异常 百度refer异常 文字显示:|正常|


  不知道大家在使用百度的时候有没有发现过百度搜索结果和网站内容不一样的情况,当然不影响网站点击的异常都可以接受,有些异常还是我们希望的,比如本人之前撰写的《收录结果网站标题的异化处理》,大家有兴趣可以查阅。

  我们先来看看百度对抓取异常的定义:对于互联网中可正常访问的内容,百度spider抓取的结果应与普通用户访问的内容是一致的,除此以外的情况,就是抓取异常。

抓取异常对网站的影响有哪些?

  对于大量内容无法正常抓取的网站,搜索引擎会认为网站存在用户体验上的缺陷,并降低对网站的评价,在抓取、索引、权重上都会受到一定程度的负面影响,最终影响到网站从百度获取的流量。

什么是IP禁封?

  限制网络的出口IP地址,禁止该IP段的使用者进行内容访问,即为IP禁封。

什么是UA禁封?

  UA即为用户代理(User-Agent),服务器通过UA识别访问者的身份。当网站针对指定UA的访问,返回异常页面(如403,500)或跳转到其他页面的情况,即为UA禁封。

什么是异常重定向?

  将网络请求重新指向其他位置即为重定向。异常重定向指的是以下几种情况

1.当前该页面为无效页面(内容已删除、死链等),直接跳转到前一目录或者首页,百度建议站长将该无效页面的入口超链接删除掉

2.重定向到出错或者无效页面

3.重定向的跳转超过3次,也为异常

注意:对于长时间跳转到其他域名的情况,如网站更换域名,百度建议使用301跳转协议进行设置。

还有哪些其他异常?

 1.针对百度refer的异常:网页针对来自百度的refer返回不同于正常内容的行为。

 2.针对百度ua的异常:网页对百度UA返回不同于页面原内容的行为。

 3.JS跳转异常:网页加载了百度无法识别的JS跳转代码,使得用户通过搜索结果进入页面后发生了跳转的情况。

 4.压力过大引起的偶然封禁:百度会根据站点的规模,访问量等信息,自动设定一个合理的抓取压力。但是在异常情况下,如压力控制失常时,服务器会根据自身负荷进行保护性的偶然封禁。这种情况下,请在返回码中返回503(其含义是“Service Unavailable”),这样百度spider会过段时间再来尝试抓取这个链接,如果网站已空闲,则会被成功抓取。

  好了,花了很长时间做概念普及,接下来我们说一下如何处理百度收录结果点击链接无法跳转到网站的处理情况,例如前几天接到一个百度refer异常的情况,见下图,收录看起来正常,但是点击收录链接却跳转到另外一个网址。

  我们可以看到,如果出现这样的情况就是百度refer异常,那么我是怎么处理解决的呢,首先检查网站首页代码有没有异常的链接,查看首页调用所有的JS代码中有没有异常的链接,如果上述确定都没有,那么请按以下步骤处理:

1.如果首页是动态网页,比如ASP,PHP,将首页新建一个静态页,代替原来网站默认打开的首页,也就说访问网站首页是个静态页,设置好首页到内页的链接

2.投诉百度快照更新问题,等待百度处理

  最终的结果就是收录更新,打开链接正常。处理完毕:>

  本人分析产生这种情况的原因大概是原来网站可能中毒,首页有木马链接,造成百度收录首页链接时记录了错误的首页链接,虽然网站做了修改但是百度还没有完成更新,使用静态页的目的是防止动态代码调用过多,使用静态页简单收录又快,所以处理完毕之后我们就可以正常使用网站了,首页静态页也可以更换成原来的动态页了,当然要保证不再有木马。


上一篇文章:网店全面征税时代来临,你的网店还开的下去吗?

下一篇文章:国外服务器如何选择?