实例解决百度快照只显示网址及其分析
时间:2022-05-13 23:54:01 | 来源:网络营销
时间:2022-05-13 23:54:01 来源:网络营销
今年6月的时候开始建设网站www.***.com,1年多的历史,提供手机壁纸的下载,百度权重是1,pr则是0。网站的界面很漂亮,内容也比较丰富,外链则没怎么建设。起初我把它作为一个新站来做,毕竟一年多没更新,和新站也基本没什么区别了。很快,百度权重升到了2,可权重上升的同时发现了百度快照的问题,百度快照只显示网址,不显示域名和描述,具体如下图:
这是怎么回事?通过几个礼拜的观察,我发现,这种现象并不是一直出现,通常平时的快照是正常的,如下图:
可一到星期五,星期六晚上的话,快照往往会变成只显示域名地址的形式。期间我也很困惑,网上查了许多资料。先让我们来看下百度站长俱乐部lee关于百度快照不显示标题和描述的解释吧。lee:原因比较复杂,需要针对性分析。主要原因可能是tag、title提取失败,系统只好从其他地方取了一些文本作为标题。这种提取失败的原因,有网页设计层面的(比如全是flash或者ajax),也有robots封禁层面的(某些重要网页虽然不抓取,但会保留url本身),robots解除禁止抓取状态,需要一段时间生效。还有一些系统异常也会造成类似的现象。如果不符合一般性的预期,这类问题都可以直接提交至webmaster@baidu.com。会有工程师跟进的。这就是lee的解释。好了,先分析下robots文件,没什么问题,再说,假设robots.txt文件有问题的话,那不可能在一个礼拜之内有几天快照是正常的,有几天快照就显示网址了。根据lee的解释,百度快照只显示域名地址,归根结底就是百度蜘蛛抓取网站的时候,抓取标题和描述失败。那究竟是什么原因呢?在网上查了好多资料,我比较认同的有三种解释:
1.服务器问题,由于服务器的问题导致百度抓取的时候不能抓取标题和描述。
2.有些cms的调用语句百度并不能很好的识别。
3.Robots文件的设置问题,由于robots文件设置不当,拒绝百度蜘蛛访问网站。
首先,针对网上说的第二点,我把模板里调用的标题和描述直间改成文字描述。观察了个把礼拜,情况依旧。Robots文件是没问题,纠结来纠结去,觉得服务器的可能性比较大。突然想到了一个网站响应时间的概念,用chinaz的工具查询了一下网站的响应时间,平时还不错,有时候偶尔会很慢,同时特地在周末试了一下,my god,响应时间慢的能有个将近5s.看来症状应该是在这里。由于周末,虚拟服务器的访问量增大导致网站的响应时间更慢。8月份,网站换了个服务器,现在已将近一个月,再没出现只显示网址的情况。同时通过chinaz工具测试的时候,网站响应时间一直很正常,保持在100到300ms之间。看来我的网站百度快照只显示网址的原因找到了。因为网站访问速度慢,用chinaz工具测试,夸张的时候能有个5s,导致百度蜘蛛在抓取的时候,抓取不到网站的标题和描述,而不得已只好以网站的域名来代替。这也很好的解释了周末这种情况比较多发的状况。
由于以前帮朋友解决过由于木马导致系统资源被大量占用,从而引起网站访问速度极慢的案例,我认为木马也能导致百度快照只显示域名而不显示标题和描述的情况。当然,这只是我的一种分析。我的依据是当你的网站的响应时间过长的话就有可能出现lee所说的Tag和title抓取失败的现象。服务器和木马,甚至是系统的原因,都可能导致网站响应时间过长。
另外我想说的一点是,百度快照只显示网址有很大一部分是因为robots文件设置的问题。但它的情况和我网站的情况是有区别的,因为robots禁止百度抓取而引起的快照问题一般能显示几个中文标题,最有代表性的就是淘宝。众所周知,淘宝是禁止百度抓取的,让我们来看下淘宝的快照,具体如下:
同时查看淘宝网页的源文件,淘宝网的标题则是:
这个标题跟百度的快照还是有一定区别的,百度快照更简单的概括了。因此根据快照具体的显示能很好的辨别是因为robots设置还是其他原因引起的百度快照只显示域名的问题。
网上还有一种解释就是cms的调用语句百度读取有困难导致百度不能读取标题和描述。对于这点,我觉得有一定道理,但不能完全认同,自己也没有看到过类似的案例,我的网站解决问题的过程也排除了这种可能性。我认为,一些使用范围比较小的cms,或者由于版本升级而新开发的调用语句有这方面的可能性。
归根结底,遇到百度快照只显示网址的情况,lee很好的总结了:主要原因可能是tag、title提取失败。同时lee也说了,这个原因比较复杂。我想:有可能是系统,有可能是服务器,有可能是网站程序本身,甚至是木马。一个很有效的途径就是查网站的响应时间,看网站的访问速度是否过慢.
本文是由手机壁纸大全的站长原创并首发于admin5,转载请注明,谢谢.