百度是否能抓取CSS和JS样式并识别分析?
百度回答:百度是能够抓取并分析CSS的。
拉萨SEO:有不少网站为了被百度和普通用户看到的内容不同,就会在网页CSS做手脚。比如,有的网页不合适直接写一行文字和<H1>标签,就会使用CSS将其隐藏,或将字体大小设为零、或把字体颜色设置成和背景色相同、或把该标签移到屏外等。有的SEO人员为了不让百度发现这种CSS设置,就掩耳盗铃地把这些样式写到CSS文件中,自以为一百度识别不出来。其实百度可以识别,如果你如上设置了但是并未被百度惩罚,并不是这种方法欺瞒过了百度,而是没有达到被惩罚的阈值而已。需要了解的是,百度目前是可以分析JS文件,在百度搜索中使用inurl指令,可以很容易地发现百度索引了不少JS文件,文件中是一堆JS代码。
百度是否抓取并分析代码中的注释内容?
因为编码和二次开发的需要,我们经常会注释掉一些内容,这些内容是否也会被百度抓取并分析呢?
百度回答:在HTML中的注释内容,会在正文提取环节忽略。
拉萨SEO:个别SEO培训机构会教学员,在注释中插入一些关键词,这本身是对搜索引擎算法的一种臆测。不能说百度会完全无视注释中的内容,至少客观地来看注释中的内容对分析网页内容意义并不是很大。除非你在注释中标明“这块是黑链”,“这块是出售的链接”,当然这也是拉萨SEO的臆测,拉萨SEO还没有见过有“正面作用”的例子,但是注释过多会造成网页体积过大。
页面大小对百度抓取有什么影响?
以前百度显示网页体积的时候最大是125KB,超过这个范围快照显示就不正常,是不是意味着网页体积大于125KB就对搜索引擎的抓取或收录有影响了?
百度回答:页面大小和搜索引擎的抓取之间没有直接关系。但我们建议网页(包括代码在内)不要过大,过大的网页会有抓取截断;而内容部分,也不要过大,过大会被索引截断。当然,抓取截断的上限,会远大于索引截断的上限。
拉萨SEO:其实这个问题意义并不是很大,SEO主要控制网页代码不要过大就好,在一张网页上堆太多的文本内容意义也不是很大。虽然现在百度也声明可以正常抓取瀑布流形式的网页,但是站长也不应该让瀑布流无限向下延伸下去。
需要注意的是:百度快照暂时是125KB的体积上限,但是索引网页体积的上限要远大于快照:同时此问题中所说的大小应该指的是网页代码的大小,而不包含图片、Flash、音乐和视频等元素,因为百度网页搜索不会索引这些元素。
文章评论 本文章有个评论