你想不到的一个细节,它居然导致你页面不收录

喜欢反复浏览百度站长公布的一些文章,经常会有意外的收货。比如今天要说的页面时间,我们都知道百度有个算法是专门针对时间来说的,但是今天这个是反面例子,是百度之前发在官网的一个案例。

你想不到的一个细节,它居然导致你页面不收录

站点求助:现象

我们网站内容发布后几个礼拜都未曾收录。

我们已将这些url放入sitemap,并使用了百度统计的集成的JS推荐,但是未曾有改善。

站点求助:自查

根据反馈中心的回复,使用抓取异常工具诊断:未发现异常

院长出手:内部追查

工程师结论:spider抓取很及时,但因为该网站没有设置内容产出时间,网站底部却有个老旧时间日期,导致spider误以为网页内容老旧(具体策略较复杂,在此不做赘述)。建议增加页面内容产生时间,去掉没有必要的时间信息。

站点总结:

1,网页上切忌勿乱加时间,如我们网站的(始于2014年9月9日)这种时间是一个大忌

2,网页内容尽可能加上产出时间,也就是发布时间

3,百度site的结果时间和权重并无太多关系

4,跟百度沟通的时候,一定要条例清晰,证据确凿。自身的问题一定要先排查准确。

总结:我们应该看得出来,百度蜘蛛仍然是有缺陷的,页面如果出现固定不变的时间,并且网站每天生产的内容页面未标记当前日期的时候,就会出现问题,百度会认为这些页面是老旧页面,不予收录。

温馨提示:本文最后更新于2022-09-21 12:14:06,某些文章具有时效性,若有错误或已失效,请在下方留言或联系丁塔克博客
© 版权声明
THE END
喜欢就支持一下吧
点赞14打赏 分享
评论 抢沙发

请登录后发表评论