百度SEO建议在SEO优化中,URL的静态化一直被作为网站优化的前提来说。事实也是如此,虽然近几年来,搜索引擎不断进化升级算法,对动态URL的抓取已经不是问题,但是URL不止是给搜索引擎看的,也要同时兼顾用户的体验。用户能从URL看出来自己处于哪个页面,并且知道自己要去哪个页面,那是极好得。
动态URL对搜索引擎的影响
现在的网站不同于以前,内容和数据量上相比大了许多,如果把大量的数据放在HTML页面去处理,是非常影响加载速度的,所以现在的网站大多都采用了数据库驱动生成的动态页面,服务器通过接收用户的请求,对数据进行整理,再交由程序进行页面的生成,而生成的这个页面并不是一直存在于服务器上的,只是实时生成的内容。因此,动态页面所对应的URL也称为动态URL,一般由各种参数和符号组成,包含等号、问号及相关参数,如下:
https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=2&tn=baiduhome_pg&wd=%E6%B1%9F%E8%A5%BFSEO&rsv_spt=1&oq=%25E8%25A5%25BF%25E5%25AE%2589SEO&rsv_pq=fbb6b8650001a002&rsv_t=a3075x2ffzK4fCeVulsTQNM45veV2bzdYIzZL%2FFW%2Bwf2s%2Brtjn5z5PGXbOjP4uD3MGVJ&rqlang=cn&rsv_enter=1&rsv_sug3=8&rsv_sug1=10&rsv_sug7=101&rsv_sug2=0&inputT=4684&rsv_sug4=4684
这是一段动态URL...除了,后面我是不想再继续看了。这段URL是我在百度搜索框搜索西安SEO产生的,我们都知道,百度数据库的体量是相当大的,这也就意味着,搜索越精准,产生的参数和符号就会越多。先不说搜索引擎识别,作为用户看见都是很头疼的。
搜索引擎在早期鼓励站长使用静态URL,主要是因为当时的搜索引擎算法还不够精细,爬虫爬行也没有完全智能化,一段充满参数和符号的动态URL很容易让搜索引擎爬虫陷入无限循环,造成大量资源上的浪费。最常见的就是以前站长都喜欢在自己的网站上放上万年历,搜索引擎在碰到万年历之后,如果一直跟踪链接,不断点击下一个月,下一年,下一日,将会陷入无穷无尽的死循环中。虽然作为用户一眼就能看出来这是个万年历,但是作为搜索引擎,看到的只是一串代码,并不能判断出这段代码真实的用途和性质。
其次,从SEO角度而言,动态URL中的参数搭配很容易产生大量重复页面,如下:
?size=42&cat=shoes&color=white
?cat=shoes&size=42&color=white
?color=white&size=42&cat=shoes
这三个URL所展示的页面是完全相同的,区别无非是猫叫咪,咪叫猫。比如第一个URL是42码的鞋子白色,第二个是鞋子42码的白色,第三个是白色42码的鞋子,本身展示的内容是一样的,但是因为后面的参数顺序发生了变化,这就导致产生了三个不同的URL,至少对搜索引擎而言是不同的。
如果参数再多一些,那这样的参数组合还能有上万上千种,但是对于搜索引擎和用户而言,它只是一个页面,所以是没有价值的,因为担心资源的浪费,搜索引擎对动态URL是抱有敬而远之的态度的。
百度SEO建议要想让网站得到搜索引擎的青睐,页面得到收录,之前我们说过,首先要做的就是对搜索引擎好一点,不要给它制造任何阻碍,最好可以夹道欢迎?开个玩笑。
怎样静态化URL
URL的静态化现在已经被大多数CMS系统和服务器所重视,一般在服务器端做URL静态化,是通过LAMP服务器的mod_rewrite模块或者Windows服务器的ISAPI REWRITE模块。(具体方法我就不细说了,各位可以自行百度一下,我个人是使用的WP系统里的固定链接和Custom Permalinks插件,所以对怎样做静态化URL没有做深入的研究)
使用这种方法做的静态URL,严格来说应该称为“伪静态”,服务器本身是不存在HTML文件的,还是在用户访问时动态生成了页面,唯一不同的就是对布满参数和符号的URL做了“伪装”。(现在也有CMS系统可以对动态页面进行真正的静态化,通过功能实现,把动态页面生成为静态,并放置在服务器上,织梦的CMS就有相关的功能)对搜索引擎而言,真正的静态和伪静态在抓取上没有区别,不过静态页面不需要服务器做数据处理,直接交给客户端去显示就可以了,这样一来,TTFB时间减少,页面加载速度也会有所提升。(类似于网页缓存功能)
URL不需要静态化了吗
文章评论 本文章有个评论