在过去的一段时间里,大家一度对收录和索引的概念非常模糊,百度工程师也曾“粗暴”地说过“收录和索引是一回事”。但实际工作中,收录和索引都有其各自的重要意义,并不能含糊地混为一谈,于是制作了这样一张图,让大家快速了解收录与索引的区别。
1,收录和索引分别指什么
收录:页面被Baiduspider发现、分析过
索引:Baiduspider经初步分析后认为有意义,做建库处理
2,收录和索引的关系
包含关系,先收录才可以建索引,收录量大于索引量。百度站长平台链接提交工具有利于网站收录。
延伸阅读:
- 百度站长平台:sitemap升级 推链接提交工具
- 新站加快收录的工具:链接提交之手动提交
- 百度上线轻量级链接提交组件 可自动推送JS代码
- 链接提交工具中四种提交方法对比(附安装使用方法)
3,收录和索引的意义
【收录意义1】收录是索引的前提:
1)站点需要保持服务器稳定(参考抓取诊断工具、抓取异常工具);
延伸阅读:
- 百度站长平台新增抓取诊断工具
- 百度抓取诊断工具有哪些需要改进的地方?
2)robots正确;
延伸阅读:
- robots.txt的写法和利用百度站长平台工具自动生成
- 网站Robots.txt协议 你懂多少?
上述内容可为Baiduspider抓取铺平道路。
【收录意义2】Baiduspider只能处理已分析过的页面,面对新旧页301和移动适配,可为已收录页面完成权值评分以及流量切换。
【索引意义1】只有被建入索引库的网页才有获得流量的机会(网页虽然被建入索引库,但获得流量的机会并不同,无效索引很难获得流量)。
【索引意义2】新闻源站点(新闻源目录)内的链接,必须先被网页库建索引,才有机会出现在新闻检索中。
4,如何查询收录量和索引量
目前百度未提供查询收录的工具,任何第三方提供的所谓收录查询都是不靠谱儿的。站长可以通过LOG日志分析估算收录,注意真假Baiduspider。
延伸阅读:
- 何清勇:浅谈百度蜘蛛“伪装”IP的影响
- 百度蜘蛛其独特的爬行研究
- 史上最全面的百度蜘蛛详解 你不得不看!
真实索引量只能通过百度站长平台索引量工具查询。
延伸阅读:
- 百度索引量工具升级版正式开放 附使用说明
- 百度索引量工具数据升级:内容质量成关键
- 索引量工具升级:移动站点排名、流量等问题说明
目前有第三方开发的工具可以辅助分析索引中页面的引流能力,如site.itseo.net(第三方工具,仅供参考)。
文章评论 本文章有个评论