首发于向阳乔木
【SEO学习之路】网址URL如何定义SEO效果最优?

【SEO学习之路】网址URL如何定义SEO效果最优?

虽然现在的搜索引擎很智能,动态的URL结构也都可以收录,但我们仍然要在URL结构上做优化,让用户和搜索引擎更加容易理解和识别,结果会更好。

下面有几个设计URL结构的原则可以参考。

URL尽可能使用单独www域名或子域名

搜索引擎会判断域名和页面的不同权重,根域名的权重越高,子域名和子目录就能继承更多权重。

到底子域名效果更好,还是子目录更好,各有各的说法。

但大量案例反馈的结论是:从子域名迁移到子目录有助于流量提升,但反向改动要小心谨慎。

从我们网站今年的测试效果来看,回收“低流量子域名”为“子目录”,流量和页面排名确实有提升。

例如: A.huangye88.com => huangey88.com/A/

据说百度最近也会打击泛域名解析的做法,所以如果网站拥有大量子域名要小心,可以考虑换为子目录。

URL要容易理解

URL越容易被人理解,搜索引擎越容易识别,用户体验变的越来越重要,现在的搜索引擎可以区别出来。

下面引用一张图说明URL可读性的重要性:


第一种:用户直接从URL就可以识别出页面大概内容,让用户忍不住点击(URL意思:被彩虹迷住的可爱宠物)

第二种:”?ID=779kw=puppies+confused” 这种URL结构,用户还是大概可以猜出来页面主题,然后点击。

第三种:URL带了各种数字、字母和#号,用户很难在点链接前就对内容做出判断,甚至可能不点链接。

但对于中文SEO,很少使用中文URL,一方面看起来有些怪,另一方面搜索引擎的识别和抓取容易出问题。

58同城的一种聚合页面也用了中文:



搜索引擎并不是不能识别中文URL,但从蜘蛛日志分析,中文URL抓取容易出BUG,所以并不是很建议这么做。

对于中文来说,使用拼音(或英文)是一种不错的URL结构,毕竟可以猜出大概意思。

URL中出现关键词仍然很好

对谷歌SEO来说,URL中出现关键词对排名提升依然有好处,原因有3个:

1、网址中出现关键词,无论是在社交媒体、电子邮件看到网址,还是鼠标悬停显示链接,用户都能大概判断内容主题,对点击率有提升。


2、当复制粘贴网址时,URL本身成为锚文本,里面包含关键词对排名提升有益。


3、研究表明,URL是搜索者在点击网址时重点考虑的因素之一。

如果多个URL内容相同,一定要做规范化处理。

如果你有内容非常相似的网址,可以使用301重定向 或 rel = “canonical” 标签。(如果这个版本很有必要保留)。

而且做了规范化后,目标URL会获得更好的排名和访问量。

尽可能排除URL中的动态参数,对URL做伪静态处理

上面的URL中有两个以上的参数,就很有必要做伪静态处理。

无论使用IIS、Apache,还是Nginx作为Web服务器,都有对应的伪静态配置方法,需要跟技术沟通处理。

也有一些动态参数用于跟踪点击次数或来源。一般来说问题不大,但是也可能让URL变的过长和丑陋。需要自己判断利弊得失,然后决定如何做。

短URL比长的好

一般来说,URL越短越好,并不是搜索引擎无法识别长URL。

较短的URL更容易识别和分享,而且不容易被截断出错,可用性和用户体验都更佳,我觉得更容易获得正确的反向链接。

尽可能让URL和标题一致


比如上图中,BBC的页面发布到社交网站时,用户无法通过URL判断页面内容,而下面的则可以通过URL知道标题,点击欲望会更强。

对于中文SEO来说,这条原则也不容易实现。但使用拼音或英文给目录命名是很好的选择。

比如我们网站的URL:

汽车发电机

qipei.huangye88.com/dia

URL使用的拼音,可以大概判断出页面是汽配子域名下,电气仪表的发电机分类。

删除保留字、不安全字符和特殊标点

有些字符需要编码后才能使用,还有些字符如果出现在URL中,容易造成蜘蛛抓取障碍,浏览器解析也可能出问题。

下面几类字符尽量不要使用:

1、不安全字符,比如”<>#%{}|\^~[]“ 最好不用用在URL中,要用也需要做URLencode处理。

2、保留字符,比如”$&+,/:;=?@“

3、非ASCII码

不少CMS,在没有做伪静态处理前,经常会用”&?=”等字符,这种动态URL对SEO不利,在搜索引擎技术不完善时候,很容易让蜘蛛进入搜索黑洞中,所以一般收录效果不好。搜索引擎技术进步了,动态页面收录越来越好,但依然建议不要这么做。

重定向不能超过两次

虽然搜索引擎支持多次重定向的网址抓取(比如301跳转),但一般都不建议多次跳转。多次跳转后,搜索引擎的排名权重可能会受影响。

更重要的是多次跳转对用户体验不好,页面加载速度变慢,用户等待时间过长,而且有些浏览器甚至会阻止多次跳转。

从漏斗模型来看也是这样,每次跳转都会损失一定的页面到达率。

URL目录层次不要过深

目录层次深,一方面会影响蜘蛛抓取,另一方面会让用户觉得网站结构复杂。

例如,下面URL的目录层次很深:
mydomain.com/jixie/gong

建议修改为:
mydomain.com/jixie/waju

曾有一些信息类网站(志趣网等),甚至直接把信息页面放到网站根目录下,不使用任何目录。有段时间这种做法百度SEO效果很好。

但仍然建议使用至少一个目录,因为目录页可以作为蜘蛛的抓取索引入口页,无论交换友情链接,还是导入内链都有着陆入口,更有利于以后目录下页面的抓取和收录。对流量统计和分析也更方便。

避免在URL中使用 ”#“号

对于HTML来说,URL中的”#“号一般都用于页面锚文本定位使用,比如我们网站

http://www.huangye88.com/#工业品

点击这个链接,就会跳转到页面的工业品模块位置。

还有一些Ajax开发的页面,为了让搜索引擎收录,曾约定使用#号来做特殊处理,比如谷歌曾针对twitter做过特殊处理,以便能抓取收录twitter的最新信息。

但后来无论amazon和twitter都摒弃了”#“号的URL处理,从而获得了巨大收益。

区分大小写

对使用Microsoft的IIS Web服务器来说,URL大小写都是一样的。
但对于使用Linux/UNIX,Web服务器使用apache或nginx,URL中不同大小写的字母,代表的是不同的页面。

需要对URL做重定向处理,转到唯一正确的页面上。

连字符”-“和下划线”_“是首选的URL分隔符

对于URL来说,连字符”-“和下划线”_“是首选的URL分隔符,空格虽然也可以正常工作,但是它们在网址中会被转码,变成以”%20“的形式呈现,这会降低页面的可读性,需要尽量避免。

详情页URL和目录页可以没有层级关系

例如:qipei.huangye88.com/dia

这是我们的一个四级列表页面,但里面的详情信息也URL结构为:

qipei.huangye88.com/xin

并没有使用
qipei.huangye88.com/dia
作为详情页的URL

因为非要按层级来设计详情页URL结构。一方面页面层级太深,另一方面如果该分类下内容有限,则不利于权重的提升和详情页的收录。

不建议使用规则的数字结构做URL

假设你有一万个信息页面,URL结构设置为:
mydomain.com/item/1.htmmydomain.com/item/10000

这个URL结构本身没问题,但这样很容易被别人发现规律并采集,这样会无形中增加网站的带宽成本,拖慢服务器速度,影响正常用户的访问。

所以在设计URL结构时候要考虑到这样的实际问题。

设计URL时要兼顾移动页面,降低适配难度

百度提供了站长平台,可以直接提交URL让百度收录,如果在设计PC URL规则时候,完全没有考虑移动URL,无法通过正则表达式进行对应适配,那就会带来麻烦。

所以设计URL结构时要同时考虑PC和移动的URL对应适配问题。

总结

常见的URL结构设计规则如上,一部分是通用规则,一部分是实战中得出的经验,希望对大家有帮助。
欢迎对SEO感兴趣的朋友家我微信交流:vista8


参考:
部分内容来自:15 SEO Best Practices for Structuring URLs

发布于 2017-07-04 15:14