帮助

SEO优化-避免蜘蛛陷阱的技巧

2019-01-15 08:57 技术文档
“蜘蛛陷阱”是阻止蜘蛛程序爬行网站的障碍物,虽然网页界面看起来非常正常,但这些蜘蛛陷阱会对蜘蛛程序造成障碍。消除这些蜘蛛陷阱,可以使蜘蛛程序收录更多的网页。SEO优化中,网页被收录是基础工作,但对于搜索引擎来讲,极少情况会100%收录你网站的所有网页,搜索引擎的爬虫程序设计得再精巧,也难以逾越所谓的蜘蛛陷阱。
 
哪些做法不利于蜘蛛爬行和抓取呢?怎么去避免这些蜘蛛陷阱呢?
1、 登录要求
有些企业站和个人站设置一定要用户注册登录后,才能看到相关的文章内容,这种对蜘蛛不是很友好,因为蜘蛛无法提交注册,更无法输入用户名和密码登录查看内容。对于蜘蛛来说,用户直接点击查看到的内容也是蜘蛛所能看到的内容。如果你的网站有这种情况,请取消这一功能,但网站如果有VIP用户或部分资源,是可以这样设置的。 
2、动态URL
 动态URL可以简单理解为在URL中加入过多的符号或者网址参数,虽然随着搜索引擎的技术发展,动态URL对于蜘蛛的抓取已经越来越不是问题了,但是从搜索引擎友好度上讲,静态哪陷是伪静态相对来说都比动态URL要好。URL优化将在本章第6节中讨论。 
3、强制用Cookies
 强制用Cookies对于搜索引擎来说相当于直接禁用了Cookies,而有些网站为了实现某些功能。会采取强制Cookies,例如跟踪用户访问路径,记住用户信息,甚至是盗取用户隐私等,如果用户访问这类站点时没有启用Cookies,所显示的页面就会不正常。所以,对于蜘蛛来讲,同样的网页无法正常访问。
4、 框架结构
早期框架网页到处被泛滥使用,而现在很多网站已经很少使用了,一是因为现在随着各大CMS系统的开发问世,网站维护相对越来越简单了,早期网站使用框架是因为对网站页面的维护有一定的便利性,现在已经大可不必了,而且不利于搜索引擎收录也是框架越来越少被使用的原因之一。
5、各种跳转
对搜索引擎来说,只对301跳转相对来说比较友好,对其他形式的跳转都比较敏感。如JavaScritp跳转、MetaRefresh跳转、Flash跳转、302跳转。  
6、Flash
有的网站页面使用Flash视觉效果是很正常的,例如用Flash做的Logo、广告、图表等,这些对搜索引擎抓取和收录是没有问题的,但很多网站的首页是一个大的Flash文件,这种就叫蜘蛛陷阱。在蜘蛛抓取时,HTML代码中只是一个链接,并没有文字,虽然大的Flash效果看上去很好,外观看着也很漂亮,但可惜搜素引擎看不到,无法读取任何内容,所以,为了能体现网站优化的最好效果,不提倡这种Flash作为首页图片。 
7、采用session id的页面
有的销售类站点为了分析用户的某些信息,会采用会话ID来跟踪用户。访问站点时,每个用户访问都会增加一次:?ssion id而加人到URL中。同样,蜘蛛的每一次访问也会被当作一个新用户。每次蜘蛛访问的URL中都会加入一个。Ession id,产生同一个页面但URL不同的情况,这种情况会产生复制内容页面,造成高度重复的内容页,同时也是最常见的蜘蛛陷阱之一。
8、JavaScript跳转
虽然现在搜索引擎对于JavaScript里的链接可以跟踪,甚至尝试拆解分析,但是我们最好不要寄望于搜索引擎自己克服困难。虽然通过JavaScript可以做一些效果不错的导航,但是CSS同样也可以做到。为了提高网站对搜索引擎的友好度,使网页能够更好地蜘蛛爬行,尽量不要采用JavaScript当然,在SEO中,JavaScript有一个好处就是站长不希望被收录的页面或者友情链接可以采用JavaSc:npt。当然,有一种方法可以消除JavaScript蜘蛛程序陷阱,即使用<noscript>标签。<noscript>标签是为不支持JavaScript的浏览器提供备选的代码。蜘蛛程序不会执行JavaScript,因此,它们通过处理<noscript>代码来代替。在SEO中,JavaScript也有一个好处就是站长不希望被收录的页面或者友情链接可以采用JavaScript。


相关推荐

QQ在线咨询