帮助

理解ETag助力站点(tga标签)提交sitemap ~ETag作用

2019-04-19 08:44 技术文档
1、ETag简介
ETag(EntityTags)是URL的tag,用来标示URL对象是不是转变,这样可独霸客户端(例如浏览器)的缓存。由处事器首先产生ETag,客户端经过过程将该记号传回处事器请求处事器验证其(客户端)缓存。处事器操作它来剖断页面是不是已经被改削,若是未改削返回304,而没需要从头传输全数对象。
2、此刻站点sitemap存在的问题问题
1.创造更新不实时
当站点或其sitemap产生更新时,百度难以实时创造并响应,由于百度难以无时无刻地延续搜检站点内容和sitemap是不是更新。
2.全量抓取,破耗带宽
此刻百度对站点sitemap的抓取会将sitemap文件完整下载下来,鉴于sitemap文件个别较大,而这类下载可能存在多次,故斗劲破耗网站的流量和带宽。
3、ETag浸染
HTTP1.1用Etag来剖断请求的文件是不是被改削,重要为体味决Last-Modified没法解决的一些问题问题
1、一些文件或许会周期性的更改,可是他的内容实在不转变(仅仅转变的改削时刻),这个时辰实在不但愿客户端感触这个文件被改削了从头GET;
2、某些文件改削很是频仍, 1秒内改削了N次,If-Modified-Since能搜检到的粒度是秒级的,这类改削没法剖断
3、某些处事器不能切确的获得文件的最后改削时刻;
为此,HTTP1.1引入了Etag.但标准并没有规定Etag的内容是甚么或者说要若何实现,唯一规定的是Etag需要放在双引号内。Etag由处事器端天生,客户端经过过程If-Match或者说If-None-Match这个条件剖断请求来验证本钱是不是改削。我们常见的是操作If-None-Match.请求一个文件的流程可能以下:
第一次请求:
1.客户端倡导HTTP GET请求一个文件;
2.处事器措置请求,返回文件内容和一堆Header,当然搜罗Etag(例如"1ec5-502264e2ae4c0")(假定处事器撑持Etag天生和已经开启了Etag).状态码200,以下图所示,初度请求百度首页时,成功获得百度logo图片文件bd_logo1.png,状态码200,巨细8.1KB,返回的Header中搜罗ETag(“1ec5-502264e2ae4c0”)。
第二次请求:
1.客户端倡导HTTP GET请求一个文件,这个时辰客户端同时发送一个If-None-Match头,这个头的内容就是我们第一次请求时处事器返回的Etag:1ec5-502264e2ae4c0
2.处事器剖断发送过去的Etag和计较出来的Etag是匹配的,不返回200,返回304,让客户端持续操作当地缓存。如图所示此次对bd_logo1.png的请求,处事器只返回了Header没有返回内容,巨细仅为349B。
4、站点启用ETag的好处
1.对sitemap启用ETag后,百度可以更快速地响应sitemap的更新,没有更改内容的景象下,处事器只发回304应对头,对流量的破耗极小,在每个head均匀227B巨细的凡是景象形象下,一成天二十四小时每秒都回应的流量破耗仅为18.7M。
2.此刻站长平台对每个站点的sitemap主动抓取次数设有上限,且这项功效没有对所有站凋谢,若是您的站点sitemap启用了ETag,并经过过程了测试,那么便可以用很小的流量享受百度实时更新您的sitemap的功效,以便于百度更好地收录您网站的内容。


相关推荐

QQ在线咨询