自从里维斯社com/so/11.html' target='_blank'>11月出现过百度不收录网站内容的问题,之后的一个月内就比较关注当天的收录情况,今天在查看文章收录的时候,发现一个与其他网站不一样的地方。明明发布文章后,十几分钟就收录了,并且可以搜索到,但是收录日期显示的是“1天内”。同样搜索了boke112当天发布的文章,它的却显示为“2小时前”。
以下的搜索结果的截图:
百度显示里维斯社文章收录情况
百度显示里维斯社文章快照
百度显示boke112文章收录情况
百度显示boke112文章快照
带着疑问和好奇,里维斯社在网络上搜索相关资料,想要解答此困惑。下面是来自网络上解释这个问题的版本:
版本一:文章发布时间不够精确
网友表示,当天收录的全部显示为“1天内”,后来通过修改了发布文章的时间精确到分钟就恢复正常了。由于文章发布显示的时间不够精确导致的。有的网站文章页面可能没有显示出发布时间,或者文章页面显示的发布时间只精确到了小时,而没有精确到分钟,所以就算百度当天收录,也是显示一天内。
网友认为:百度爬虫毕竟是程序,还没有那么智能,不给出具体的参考它不知道如何判断文章发布具体的时间,所以只能显示一天内,因为没有参考时间。
解决方法:在文章模版处,加上“时”和“分”就可以了,当然你也可以加“秒”,本人认为没有必要精确到秒。
版本二:百度自身作祟,秒收也是1天内
现在网站一天内的收录不显示具体时间了?之前网站当天收录的都会显示具体是几个小时之前的,现在怎么没有了?你们的是这样吗?
里维斯社百度当天收录情况
boke112当天收录情况
网友回答:早就是这样了,秒收也是1天内;
版本三:权重和文章质量导致
网友说:为什么网站文章收录后快照显示是几分钟前,与1天内到底有什么区别?我的网站域龄也不是很高,从最初的隔天放出收录文章,到几小时放出收录快照,再到秒收。在这个过程中,我发现网站文章收录后的快照,有的快照左边显示1天内,注意我的文章是秒收的,但是为什么会显示1天内呢?我很纳闷有些大站比如说天涯,刚收录的文章,快照显示时间都精确到秒了,比如说几秒前、几分钟前。那么我就在思考这里边到底是什么区别?
导致这个原因的因素有2点:
第一个、网站的权重:很多高权重的网站,通常文章被收录后放出的快照都会显示具体的时间,比如上边所说的天涯文章快照。而一般普通网站,比如说新站,收录文章通常会建库,但是快照放出就很慢了,因为新域名有考察期,这与域名的信任度有关系。
第二个、文章质量:这个不用多说,文章质量高一般会促进收录,根据文章的稀缺性决定放出快照的时间长短。所以等放出来的快照一般时间会显示1天前或者是几天前。
所以网站文章被收录后,快照能及时显示几分钟或者几小时前,甚至几秒前,那足以证明这个网站在度娘心中的地位。千万别小看这个细微区别,这也的暗示网站质量的另一种潜在因素。
版本四:与CDN缓存设置无关
网友提问:网站启用 CDN,为什么百度收录时间显示为1天前?网站启用 CDN、在百度 site 网站收录,收录时间显示为1天前。内容都是原创,文章发布时间和收录文章的快照时间,有的相差几十秒,有的相差几分钟,有的相差几小时。但是所有的site展示都是显示1天前,而不是几小时或者多少分钟。这种情况是否和 CDN缓存设置有问题,CDN用腾讯的。
zac回答:你说的情况和 CDN 没什么关系。搜索引擎显示的快照时间和文章发布的时间没有必然联系。快照时间是搜索引擎蜘蛛最近一次抓取页面的时间。如果页面没有更新,搜索引擎可能不更新索引,也就不更新快照,所以快照时间可能是更早的抓取时间。但大致上可以理解为上一次抓取的时间,和文章什么时候发布上线没有关系。如果你的文章都是显示快照为一天前的,就是说百度蜘蛛基本上每天来抓取,已经很好了。
网络上介绍的相关内容不是很多,里维斯社也没有从中找到这个问题的根本原因,只是比较认同版本三中所说的网站权重和文章质量造成的影响。如果你有更好的答案,欢迎评论留言。
80%的人都看过的文章
- 分析:网站不收录,Baiduspider每次抓取耗时长
- 熊掌号解散?百度搜索引擎恢复其搜索“特权”?
- 百度首次公开百度小程序蜘蛛UA渠道
- 新网站上线一个月没收录怎么办?
- 关于“伪原创文章”的站点,千万别误解了
- 为什么百度只收录内页,不收录首页?
- 为什么我的博客百度只收录了首页?
- 网站降权原因分析及恢复周期详解