文件缓存服务器流程_缓存服务器的缓存服务器原理

‘壹’ 如何将html文件缓存到服务器内存（iis）

你把后缀名改为aspx，然后加上缓存属性不就可以了吗？

如果不改后缀，IIS会直接自己处理html文件，根本到不了.net处理程序，更不用谈缓存到内存中。

当然你也可以修改html文件的映射，然后自己写httpHandler，不过这样貌似太过多此一举了。

‘贰’ Okhttp解析（五）缓存的处理

大家好，之前我们讲解了Okhttp网络数据请求相关的内容，这一节我们讲讲数据缓存的处理。本节按以下内容讲解Okhttp缓存相关的内容。

缓存的使用场景很多，通过它可以将数据通过一定的规则存储起来，再次请求数据的时候就可以快速从缓存中读取了，缓存有以下优势。

HTTP本身提供了一套缓存相关的机制。这套机制定义了相关的字段和规则，用来客户端和服务端进行缓存相关的协商，如响应的数据是否需要缓存，缓存有效期，缓存是否有效，服务器端给出指示，而客户端则根据服务端的指示做具体的缓存更新和读取缓存工作。http缓存可以分为两类：

强制缓存，在缓存数据未失效的情况下，可以直接使用缓存数据，有两个字段Expires和Cache-Control用于标明失效规则。

表示过期时间，由服务端返回。那么下次请求数据时，判断这个Expires过期时间是否已经过了，如果还没有到过期时间，则使用缓存，如果过了过期时间，则重新请求服务器的数据。Expires格式如下：

不过因为服务器和客户端的时间并不是同步的，用一个绝对时间作为过期的标记并不是很明智，所以HTTP1.1之后更多的是Cache-Control，它的控制更加灵活。

表示缓存的控制，有服务端返回。它有以下几个取值：

默认情况下是private，也就是不能共享的。Cache-Control格式如下：

对比缓存，表示需要和服务端进行相关信息的对比，由服务器决定是使用缓存还是最新内容，如果服务器判定使用缓存，返回响应吗304，判定使用最新内容，则返回响应码200和最新数据。对比缓存的判定字段有两组：

ETag表示资源的一种标识信息，用于标识某个资源，由服务端返回，优先级更高。格式如下：

然后客户端再次请求时，加入字段If-None-Match，格式如下：

服务端收到请求的该字段时（之前的Etag值），和资源的唯一标识进行对比，如果相同，说明没有改动，则返回状态码304，如果不同，说明资源被改过了，则返回状态码200和整个内容数据。

Last-Modified表示资源的最近修改时间，由服务端返回，优先级更低。格式如下：

Last-Modified
由服务器返回，表示响应的数据最近修改的时间。

If-Modified-Since
由客户端请求，表示询问服务器这个时间是不是上次修改的时间。如果服务端该资源的修改时间小于等于If-Modified-Since指定的时间，说明资源没有改动，返回响应状态码304，可以使用缓存。如果服务端该资源的修改时间大于If-Modified-Since指定的时间，说明资源又有改动了，则返回响应状态码200和最新数据给客户端，客户端使用响应返回的最新数据。

Last-Modified字段的值（服务端返回的资源上次修改时间），常常被用于客户端下次请求时的If-Modified-Since字段中。

HTTP的缓存规则是优先考虑强制缓存，然后考虑对比缓存。

Okhttp缓存相关的类有如下：

要开启使用Okhttp的缓存其实很简单，只需要给OkHttpClient对象设置一个Cache对象即可，创建一个Cache时指定缓存保存的目录和缓存最大的大小即可。

那么下面我们来看看Okhttp缓存执行的大概流程

Okhttp的缓存流程分为读取缓存和存储缓存两个过程，我们分别分析。

读取使用缓存的流程从HttpEngine的sendRequest发送请求开始。

接下来我们分析

从Cache的get方法开始。它按以下步骤进行。

如果存在缓存的话，在指定的缓存目录中，会有两个文件“****.0”和“****.1”，分别存储某个请求缓存的响应头和响应体信息。（“****”是url的md5加密值）对应的ENTRY_METADATA响应头和ENTRY_BODY响应体。缓存的读取其实是由DiskLruCache来读取的，DiskLruCache是支持Lru（最近最少访问）规则的用于磁盘存储的类，对应LruCache内存存储。它在存储的内容超过指定值之后，就会根据最近最少访问的规则，把最近最少访问的数据移除，以达到总大小不超过限制的目的。

接下来我们分析CacheStrategy缓存策略是怎么判定的。

直接看CacheStrategy的get方法。缓存策略是由请求和缓存响应共同决定的。

接来下我们看看CacheControl类里有些什么。

可以发现，它就是用于描述响应的缓存控制信息。

然后我们再看看Okhttp存储缓存是怎么进行的。

存储缓存的流程从HttpEngine的readResponse发送请求开始的。

可以看到这里先通过maybeCache写入了响应头信息，再通过cacheWritingResponse写入了响应体信息。我们再进去看Cache的put方法实现。

我们继续看Cache的writeTo方法，可以看到是写入一些响应头信息。

到这里Okhttp缓存的读取和存储流程我们就清楚了。可以说，缓存的使用策略基本都是按照HTTP的缓存定义来实现的，所以对HTTP缓存相关字段的理解是很重要的。然后关于DiskLruCache是如何管理缓存文件的，这个其实也很好理解，首先的原则就是按照LRU这种最近最少使用删除的原则，当总的大小超过限定大小后，删除最近最少使用的缓存文件，它的LRU算法是使用LinkedHashMap进行维护的，这样来保证，保留的缓存文件都是更常使用的。具体实现大家可以分析DiskLruCache和LinkedHashMap的实现原理。

‘叁’ http缓存过程

注：http 缓存只能缓存 get 方式请求的资源
缓存是指 代理服务器 或 客户端本地磁盘 内保存的资源副本。利用缓存可减少对源服务器的访问，因此也就节省了通信流量和通信时间。
缓存服务器是代理服务器的一种，并归类在缓存代理类型中。换句话说， 当代理转发从服务器返回的响应时，代理服务器将会保存一份资源的副本 。
缓存服务器的优势在于利用缓存可避免多次从源服务器转发资源。因此客户端可就近从缓存服务器上获取资源，而源服务器也不必多次处理相同的请求了。

浏览器缓存分 强制缓存 和 协商缓存 ，分别使用的字段前者是Expires和Cach-control，后者是 Etag 和 Last-modified。

Expires (http/1.0)：设的是资源的过期时间（绝对时间），浏览器判断这次请求的时候是不是超过这个日期，没超的话就直接读取缓存中的资源，不向服务器发请求。

Pragma ：字段值为“no-cache”的时候，会通知客户端不要对该资源读缓存，即每次都得向服务器发一次请求才行。但是这种禁用缓存的形式作用不是那么太大：1. 仅有IE才能识别这段meta标签含义，其它主流浏览器仅能识别“Cache-Control: no-store”的meta标签。2. 在IE中识别到该meta标签含义，并不一定会在请求字段加上Pragma，但的确会让当前页面每次都发新请求，但是仅限页面，页面上的资源则不受影响。
如果Pragma和Expires一起出现的话，Pragma的优先级是高的。

Cach-Control (http/1.1)：缓存控制示例：

Cache-Control 有三种属性：缓冲能力、过期时间和二次验证。

缓冲能力:

过期时间:

二次验证:

Expires使用的是服务端时间，可能出现客户端和服务端时间不同步，导致本地缓存无用或无法过期。
Max-Age使用的是客户端本地时间的计算，不会出现这个问题，推荐Max-Age。
如果同时启用了Cache-Control和Pragma ，Expires，Cache-Control优先级高。

Last-Modified / If- Modified-Since (http/1.0)：判断资源最后修改时间，只要这个日期改变了就不使用缓存。浏览器的头部是If- Modified-Since，服务端的是Last-Modified，如果两个匹配，代表服务器资源未改变，服务端不会返回资源实体，只返回头部，通知浏览器使用缓存。
缺点：可能有些文件会周期性地改变日期，但是内容其实没变，但是该字段只判断最后修改时间，
E-tag / If-None-Match (http/1.1)：Etag 是服务器针对请求的资源文件生成的唯一标识，只要文件内容没变化，则Etag值不变，克服了 Last-Modified / If- Modified-Since 的缺点。浏览器的头部是If-None-Match，服务端的是E-tag，如果两个匹配，代表内容未改变，通知浏览器使用缓存。
Etag 缺点：不适用于分布式系统，因为每个服务器上的 Etag 值不同。

如果同时带有E-tag和Last-Modified，服务端优先检查E-tag。

‘肆’ 缓存服务器的缓存服务器原理

Web缓存服务器的应用模式主要是正向代理和反向代理。正向代理(Proxy)模式是代理网络用户访问internet，客户端将本来要直接发送到internet上源服务器的连接请求发送给代理服务器处理。正向代理的目的是加速用户在使用浏览器访问Internet时的请求响应时间，并提高广域网线路的利用率。正向代理浏览器无需和该站点建立联系，只访问到Web缓存即可。通过正向代理，大大提高了后续用户的访问速度，使他们无需再穿越Internet，只要从本地Web缓存就可以获取所需要的信息，避免了带宽问题，同时可以大量减少重复请求在网络上的传输，从而降低网络流量，节省资费。
反向代理(Reverse Proxy)模式是针对Web服务器加速功能的，在该模式中，缓存服务器放置在web应用服务器的前面，当用户访问web应用服务器的时候，首先经过缓存服务器，并将用户的请求和应用服务器应答的内容写入缓存服务器中，从而为后续用户的访问提供更快的响应。其工作原理如下图所示。

‘伍’ web服务器怎么使用redis分步式缓存

Redis复制流程概述
Redis的复制功能是完全建立在之前我们讨论过的基于内存快照的持久化策略基础上的，也就是说无论你的持久化策略选择的是什么，只要用到了Redis的复制功能，就一定会有内存快照发生，那么首先要注意你的系统内存容量规划，原因可以参考我上一篇文章中提到的Redis磁盘IO问题。
Redis复制流程在Slave和Master端各自是一套状态机流转，涉及的状态信息是：
Slave 端：
REDIS_REPL_NONEREDIS_REPL_CONNECTREDIS_REPL_CONNECTED
Master端：
REDIS_REPL_WAIT_BGSAVE_STARTREDIS_REPL_WAIT_BGSAVE_ENDREDIS_REPL_SEND_BULKREDIS_REPL_ONLINE
整个状态机流程过程如下：
Slave端在配置文件中添加了slave of指令，于是Slave启动时读取配置文件，初始状态为REDIS_REPL_CONNECT。
Slave端在定时任务serverCron(Redis内部的定时器触发事件)中连接Master，发送sync命令，然后阻塞等待master发送回其内存快照文件(最新版的Redis已经不需要让Slave阻塞)。
Master端收到sync命令简单判断是否有正在进行的内存快照子进程，没有则立即开始内存快照，有则等待其结束，当快照完成后会将该文件发送给Slave端。
Slave端接收Master发来的内存快照文件，保存到本地，待接收完成后，清空内存表，重新读取Master发来的内存快照文件，重建整个内存表数据结构，并最终状态置位为 REDIS_REPL_CONNECTED状态，Slave状态机流转完成。
Master端在发送快照文件过程中，接收的任何会改变数据集的命令都会暂时先保存在Slave网络连接的发送缓存队列里（list数据结构），待快照完成后，依次发给Slave,之后收到的命令相同处理，并将状态置位为 REDIS_REPL_ONLINE。

整个复制过程完成，流程如下图所示：

Redis复制机制的缺陷
从上面的流程可以看出，Slave从库在连接Master主库时，Master会进行内存快照，然后把整个快照文件发给Slave，也就是没有象Mysql那样有复制位置的概念，即无增量复制，这会给整个集群搭建带来非常多的问题。
比如一台线上正在运行的Master主库配置了一台从库进行简单读写分离，这时Slave由于网络或者其它原因与Master断开了连接，那么当Slave进行重新连接时，需要重新获取整个Master的内存快照，Slave所有数据跟着全部清除，然后重新建立整个内存表，一方面Slave恢复的时间会非常慢，另一方面也会给主库带来压力。
所以基于上述原因，如果你的Redis集群需要主从复制，那么最好事先配置好所有的从库，避免中途再去增加从库。
Cache还是Storage
在我们分析过了Redis的复制与持久化功能后，我们不难得出一个结论，实际上Redis目前发布的版本还都是一个单机版的思路，主要的问题集中在，持久化方式不够成熟，复制机制存在比较大的缺陷，这时我们又开始重新思考Redis的定位：Cache还是Storage？
如果作为Cache的话，似乎除了有些非常特殊的业务场景，必须要使用Redis的某种数据结构之外，我们使用Memcached可能更合适，毕竟Memcached无论客户端包和服务器本身更久经考验。
如果是作为存储Storage的话，我们面临的最大的问题是无论是持久化还是复制都没有办法解决Redis单点问题，即一台Redis挂掉了，没有太好的办法能够快速的恢复，通常几十G的持久化数据，Redis重启加载需要几个小时的时间，而复制又有缺陷，如何解决呢？
Redis可扩展集群搭建1. 主动复制避开Redis复制缺陷。
既然Redis的复制功能有缺陷，那么我们不妨放弃Redis本身提供的复制功能，我们可以采用主动复制的方式来搭建我们的集群环境。
所谓主动复制是指由业务端或者通过代理中间件对Redis存储的数据进行双写或多写，通过数据的多份存储来达到与复制相同的目的，主动复制不仅限于用在Redis集群上，目前很多公司采用主动复制的技术来解决MySQL主从之间复制的延迟问题，比如Twitter还专门开发了用于复制和分区的中间件gizzard(https://github.com/twitter/gizzard) 。
主动复制虽然解决了被动复制的延迟问题，但也带来了新的问题，就是数据的一致性问题，数据写2次或多次，如何保证多份数据的一致性呢？如果你的应用对数据一致性要求不高，允许最终一致性的话，那么通常简单的解决方案是可以通过时间戳或者vector clock等方式，让客户端同时取到多份数据并进行校验，如果你的应用对数据一致性要求非常高，那么就需要引入一些复杂的一致性算法比如Paxos来保证数据的一致性，但是写入性能也会相应下降很多。
通过主动复制，数据多份存储我们也就不再担心Redis单点故障的问题了，如果一组Redis集群挂掉，我们可以让业务快速切换到另一组Redis上，降低业务风险。
2. 通过presharding进行Redis在线扩容。
通过主动复制我们解决了Redis单点故障问题，那么还有一个重要的问题需要解决：容量规划与在线扩容问题。
我们前面分析过Redis的适用场景是全部数据存储在内存中，而内存容量有限，那么首先需要根据业务数据量进行初步的容量规划，比如你的业务数据需要100G存储空间，假设服务器内存是48G，那么根据上一篇我们讨论的Redis磁盘IO的问题，我们大约需要3~4台服务器来存储。这个实际是对现有业务情况所做的一个容量规划，假如业务增长很快，很快就会发现当前的容量已经不够了，Redis里面存储的数据很快就会超过物理内存大小，那么如何进行Redis的在线扩容呢？
Redis的作者提出了一种叫做presharding的方案来解决动态扩容和数据分区的问题，实际就是在同一台机器上部署多个Redis实例的方式，当容量不够时将多个实例拆分到不同的机器上，这样实际就达到了扩容的效果。
拆分过程如下：
在新机器上启动好对应端口的Redis实例。
配置新端口为待迁移端口的从库。
待复制完成，与主库完成同步后，切换所有客户端配置到新的从库的端口。
配置从库为新的主库。
移除老的端口实例。
重复上述过程迁移好所有的端口到指定服务器上。

以上拆分流程是Redis作者提出的一个平滑迁移的过程，不过该拆分方法还是很依赖Redis本身的复制功能的，如果主库快照数据文件过大，这个复制的过程也会很久，同时会给主库带来压力。所以做这个拆分的过程最好选择为业务访问低峰时段进行。
Redis复制的改进思路
我们线上的系统使用了我们自己改进版的Redis,主要解决了Redis没有增量复制的缺陷，能够完成类似Mysql Binlog那样可以通过从库请求日志位置进行增量复制。
我们的持久化方案是首先写Redis的AOF文件，并对这个AOF文件按文件大小进行自动分割滚动，同时关闭Redis的Rewrite命令，然后会在业务低峰时间进行内存快照存储，并把当前的AOF文件位置一起写入到快照文件中，这样我们可以使快照文件与AOF文件的位置保持一致性，这样我们得到了系统某一时刻的内存快照，并且同时也能知道这一时刻对应的AOF文件的位置，那么当从库发送同步命令时，我们首先会把快照文件发送给从库，然后从库会取出该快照文件中存储的AOF文件位置，并将该位置发给主库，主库会随后发送该位置之后的所有命令，以后的复制就都是这个位置之后的增量信息了。

Redis与MySQL的结合
目前大部分互联网公司使用MySQL作为数据的主要持久化存储，那么如何让Redis与MySQL很好的结合在一起呢？我们主要使用了一种基于MySQL作为主库，Redis作为高速数据查询从库的异构读写分离的方案。
为此我们专门开发了自己的MySQL复制工具，可以方便的实时同步MySQL中的数据到Redis上。

（MySQL-Redis 异构读写分离）
总结：
Redis的复制功能没有增量复制，每次重连都会把主库整个内存快照发给从库，所以需要避免向在线服务的压力较大的主库上增加从库。
Redis的复制由于会使用快照持久化方式，所以如果你的Redis持久化方式选择的是日志追加方式(aof),那么系统有可能在同一时刻既做aof日志文件的同步刷写磁盘，又做快照写磁盘操作，这个时候Redis的响应能力会受到影响。所以如果选用aof持久化，则加从库需要更加谨慎。
可以使用主动复制和presharding方法进行Redis集群搭建与在线扩容。

‘陆’ 怎么架设缓存服务器

问题一：如何架设缓存DNS服务器 Windows Server配置缓存DNS：
安装DNS后，不设置任何zone。只通过forwarder、root hint对名称进行解析。参考：
technet.microsoft/...217396

有问题的话你可以直接到微软的论坛提问：social.technet.microsoft/Forums/en-us/home

问题二：服务器缓存怎么设置啊双核cpu 用ok缓存，是单核心cpu用liunx的缓存

问题三：怎么搭建一个tair缓存服务器能啊，不过不知你要怎么做。
一般来说，对企业级用户才需要这些功能。主要就是避开上网高峰期，利用夜间来把网页等内容缓存下来，到了白天再用，再打开时可以看到网页是前一天或当天凌晨的。不过，不要紧，一点“刷新”就好了，因为大部分内容都下来了，改动也就很少，浏览网页的速度也就很快了。
方法我知道有两种，都是基于系统服务器的：1 WINDOWS系统下可以装一个ISA2000之类的软件，它可以提供防火墙、NAT、缓存三大功能。这个软件一时半会说不清楚，你可以自己下一个下来慢慢来，并不是很难碰芦。2 LINUX系统下也可以实现，在安装了一个叫squid的服务后，这个功能就可以再通过配置来实现，不过配置全是用命令，有点困难了。
最后，建议用ISA来做，或者找些专用的小软件之类的。顺便问一下，你该不是在开网吧，自学吧。

问题四：如何将一个页面缓存一天，服务器该如何设置 16G??20台? ?安装2008SP2? ?系统自己缓存就可以了查看原帖>>

问题五：linux网吧缓存服务器如何架设现成的缓存服务器MQCache，下载安装，省时又省力

问题六：Win2003系统缓存怎么设置(服务器) 20分的电脑--属性---高级----性能“设置”---高级---虚拟内存“设置”，可修改腔做页面大小等。。。

问题七：16G服务器，怎么设置缓存啊！ - 16G??20台? ?安装2008SP2? ?系统自己缓存就可以了查看原帖>>

问题八：如何在IIS里设置服务器端缓存时间？设置IIS缓存的方法
1.测试，可以缓存整个Share工程（经测试IIS中的缓存测试对ASPX页面不起作用，估计与页面压缩的设置原理一样）；
2.需要设置缓存的工程： Share，Portal（根据IIS日志分析报告中的“Most Requested Directories”得出）；
3.设置的方法：
第一步：
打开 IIS 配置管理工具（Internet 信息服务(IIS)管理器）。
选中一个目录（或者网站，如果您想为所有站点配置，请选择点中“网站”那个图标），点“属性”按钮，会弹出一个配置窗口
第二步：
选择“HTTP 头” TAB 标签，然后您会看到：“自定义 HTTP 头”一栏。
第三步：
点旁边的“添加(D)...”按钮，来添加上那条命令。
在弹出的窗口中：“自定义 HTTP 头名(C)”中输入：“Cache-Control”，在“自定义 HTTP 头值(U)”中输入：“Must-revalidate”。
Cache-Control头的参数设置：
Public 响应会被缓存，并且在多用户间共享。
Private 响应只能够作为私有的缓存，不能再用户间共享。
No-cache 响应不会被缓存
No-store 响应不会被缓存，并且不会被写入到客户端的磁盘里，这也是基于安全考虑的某些敏感的响应才会使用这个。
Max-age=#seconds 响应将会某个指定的秒数内缓存，一旦时间过了，就不会被缓存。
Must-revalidate 响应会被重用来满足接下来的请求，但是它必须到服务器端去验证它是不是仍然是最新的。
注意：
如果你要想在iis中配置缓存，请参阅微软的知识技术文章：
・ How to Modify the Cache-Control HTTP Header When You Use IIS.
不知道这样可以不可以啊。

问题九：做前端静态资源缓存服务器有哪些成熟易搭建的方案我现在是把阿里云的笑圆带 CDN 直接解析到 OSS 。
每天的 PV ， 1 万到 5 万。
然而才用了一个多月就跑了 300+G 流量。 0.36/GB 。泪。
阿里云的 CDN 实在是太贵了，用峰值带宽的话，根本就不能控制成本啊！万一有个用户 100M 水管，那一天岂不是要付 100 块钱？
所以还不如选一个好一点的 BGP 线路机器反代到 OSS 。
自己用 squid 搭建吗？
如果主站是 HTTPS 的， squid 能配置 SSL 吗？还是说要 nginx 配置 SSL 以后再去反代 squid ，然后 squid 反代 oss ？
有没有配置脚本？
还是装个 AMH/WDCP 之类面板，然后可以傻瓜化配置？
对主机磁盘 IO 、内存有什么要求？

问题十：安装秒开缓存服务器后怎么检测数据是否走缓存了？两个：
一是设置浏览器，以IE为例，打开工具-Internet选项-Internet临时文件里的设置，改为每次访问时检查
二是设置服务器端,以IIS为例，设置内容过期为立即过期，那这样每次都会从服务器下载新的数据，代价是服务器的带宽占用大幅度上升

‘柒’ 缓存服务器Cache-only是怎么工作的

4．CDN 的工作原理

在描述CDN的实现原理，让我们先看传统的未加缓存服务的访问过程，以便了解CDN缓存访问方式与未加缓存访问方式的差别： http://www.video.com.cn/club/attachment.php?aid=939&k=&t=1218114144&noupdate=yes
由上图可见，用户访问未使用CDN缓存网站的过程为:

1)、用户向浏览器提供要访问的域名；

2)、浏览器调用域名解析函数库对域名进行解析，以得到此域名对应的IP地址；

3)、浏览器使用所得到的IP地址，域名的服务主机发出数据访问请求；

4)、浏览器根据域名主机返回的数据显示网页的内容。

通过以上四个步骤，浏览器完成从用户处接收用户要访问的域名到从域名服务主机处获取数据的整个过程。CDN网络是在用户和服务器之间增加Cache层，如何将用户的请求引导到Cache上获得源服务器的数据，主要是通过接管DNS实现，下面让我们看看访问使用CDN缓存后的网站的过程： http://www.video.com.cn/club/attachment.php?aid=940&k=&t=1218114144&noupdate=yes
通过上图，我们可以了解到，使用了CDN缓存后的网站的访问过程变为：

1)、用户向浏览器提供要访问的域名；

2)、浏览器调用域名解析库对域名进行解析，由于CDN对域名解析过程进行了调整，所以解析函数库一般得到的是该域名对应的CNAME记录，为了得到实际IP地址，浏览器需要再次对获得的CNAME域名进行解析以得到实际的IP地址；在此过程中，使用的全局负载均衡DNS解析，如根据地理位置信息解析对应的IP地址，使得用户能就近访问。
3)、此次解析得到CDN缓存服务器的IP地址，浏览器在得到实际的IP地址以后，向缓存服务器发出访问请求；

4)、缓存服务器根据浏览器提供的要访问的域名，通过Cache内部专用DNS解析得到此域名的实际IP地址，再由缓存服务器向此实际IP地址提交访问请求；

5)、缓存服务器从实际IP地址得得到内容以后，一方面在本地进行保存，以备以后使用，二方面把获取的数据返回给客户端，完成数据服务过程；

6)、客户端得到由缓存服务器返回的数据以后显示出来并完成整个浏览的数据请求过程。

通过以上的分析我们可以得到，为了实现既要对普通用户透明(即加入缓存以后用户客户端无需进行任何设置，直接使用被加速网站原有的域名即可访问)，又要在为指定的网站提供加速服务的同时降低对ICP的影响，只要修改整个访问过程中的域名解析部分，以实现透明的加速服务，下面是CDN网络实现的具体操作过程。

1)、作为ICP，只需要把域名解释权交给CDN运营商，其他方面不需要进行任何的修改；操作时，ICP修改自己域名的解析记录，一般用cname方式指向CDN网络Cache服务器的地址。

2)、作为CDN运营商，首先需要为ICP的域名提供公开的解析，为了实现sortlist，一般是把ICP的域名解释结果指向一个CNAME记录；

3)、当需要进行sorlist时，CDN运营商可以利用DNS对CNAME指向的域名解析过程进行特殊处理，使DNS服务器在接收到客户端请求时可以根据客户端的IP地址，返回相同域名的不同IP地址；

4)、由于从cname获得的IP地址，并且带有hostname信息，请求到达Cache之后，Cache必须知道源服务器的IP地址，所以在CDN运营商内部维护一个内部DNS服务器，用于解释用户所访问的域名的真实IP地址；

5)、在维护内部DNS服务器时，还需要维护一台授权服务器，控制哪些域名可以进行缓存，而哪些又不进行缓存，以免发生开放代理的情况。

‘捌’ 浏览器缓存和服务器缓存

一、浏览器缓存

浏览器缓存即http缓存；浏览器缓存根据是否需要向服务器重新发起HTTP请求将缓存过程分为两个部分，分别是强制缓存和协商缓存。

浏览器第一次请求资源的时候服务器会告诉客户端是否应该缓存资源，根据响应报文中HTTP头的缓存标识，决定是否缓存结果，是则将请求结果和缓存标识存入浏览器缓存中。如下图：

1.强制缓存：浏览器会对缓存进行查找，并根据一定的规则确定是否使用缓存。

强制缓存的缓存规则？

HTTP/1.0 Expires 这个字段是绝对时间，比如2018年6月30日12:30，然后在这个时间点之前的请求都会使用浏览器缓存，除非清除了缓存。

这个字段的缺点就是只会同步客户端的时间，这就有可能修改客户端时间导致缓存失效。

HTTP/1.1 cache-Control    这个是1.1的时候替换Expires的，它会有几种取值：

public ：所有内容都将被缓存（客户端和代理服务器都可缓存）

private ：所有内容只有客户端可以缓存， Cache-Control的默认取值

no-cache ：客户端缓存内容，但是是否使用缓存则需要经过协商缓存来验证决定

no-store ：所有内容都不会被缓存，即不使用强制缓存，也不使用协商缓存

max-age=xxx (xxx is numeric) ：缓存内容将在xxx秒后失效

比如max-age=500，则在500秒内再次请求会直接只用缓存。

优先性：cache-Control > Expires

如果同时存在，cache-Control会覆盖Expires。

这个字段的缺点就是：

如果资源更新的速度是秒以下单位，那么该缓存是不能被使用的，因为它的时间单位最低是秒。

如果文件是通过服务器动态生成的，那么该方法的更新时间永远是生成的时间，尽管文件可能没有变化，所以起不到缓存的作用。

上图中浏览器缓存中存在该资源的缓存结果，并且没有失效，就会直接使用缓存的内容。

上图中浏览器缓存中没有该资源的缓存结果和标识，就会直接向服务器发起HTTP请求。

2.协商缓存：浏览器的强制缓存失效后(时间过期)，浏览器携带缓存标识请求服务器，由服务器决定是否使用缓存。

服务器决定的规则？

控制协商缓存的字段有 Last-Modified / If-Modified-Since 和 Etag / If-None-Match。

①Last-Modified 是服务器返回给浏览器的本资源的最后修改时间。

当下次再次请求的时候，浏览器会在请求头中带 If-Modified-Since ,即上次请求下来的 Last-Modified 的值，

然后服务器会用这个值和该资源最后修改的时间比较，如果最后修改时间大于这个值，则会重新请求该资源，返回状态码200。

如果这个值和最后修改时间相等，则会返回304，告诉浏览器继续使用缓存。

② Etag 是服务器返回的一个hash值。

当下次再次请求的时候，浏览器会在请求头中带 If-None-Match ,即上次请求下来的 Etag 值，

然后服务器会用这个值和该资源在服务器的 Etag 值比较，如果一致则会返回304，继续使用缓存；如果不一致，则会重新请求，返回200。

二、服务器缓存

上面是一个简单的流程图：

用户1访问A页面，服务器解析A页面返回给用户1，同时在服务器内存上做一定映射，把A页面缓存在硬盘上面

用户2访问A页面，服务器直接根据内存上的映射找到对应的页面缓存，直接返回给用户2，这样就减少了服务器对同一页面的重复解析

服务器缓存和浏览器缓存的区别：

服务器缓存是把页面缓存到服务器上的硬盘里，而浏览器缓存是把页面缓存到用户自己的电脑里

Nginx服务器

Nginx是一个高性能的HTTP和反向代理服务器。具有非常多的优越性：

在连接高并发的情况下，Nginx是Apache服务器不错的替代品，Nginx在美国是做虚拟主机生意的老板们经常选择的软件平台之一。

Nginx提供了expires、etag、if-modified-since指令来实现浏览器缓存控制。

nginx -s reload#重新加载配置文件

nginx -s reopen#重新打开log文件

nginx -s stop#快速关闭nginx服务

nginx -s quit #优雅的关闭nginx服务，等待工作进程处理完所有的请求

Nginx设置静态文件的缓存过期时间

location ~.*\.(js|css|html|png|jpg)$ {

expires 3d;

}

expires    3d;//表示缓存3天

expires    3h;//表示缓存3小时

expires    max;//表示缓存10年

expires    -1;//表示永远过期。

如果设置为-1在js、css等静态文件在没有修改的情况下返回的是http 304，如果修改返回http 200

对于静态资源会自动添加ETag，可以通过添加etag off指令禁止生成ETag。如果是静态文件，那么Last-Modified值为文件的最后修改时间。

在开发调试web的时候，经常会碰到因浏览器缓存(cache)而经常要去清空缓存或者强制刷新来测试的烦恼，提供下apache不缓存配置和nginx不缓存配置的设置。在常用的缓存设置里面有两种方式，都是使用add_header来设置：分别为Cache-Control和Pragma。

location ~ .*\.(css|js|swf|php|htm|html )$ {

add_header Cache-Control no-store;

add_header Pragma no-cache;

}

nginx gzip压缩

使用 gzip 压缩可以降低网站带宽消耗，同时提升访问速度。

主要在nginx服务端将页面进行压缩，然后在浏览器端进行解压和解析，

目前大多数流行的浏览器都迟滞gzip格式的压缩，所以不用担心。

默认情况下，Nginx的gzip压缩是关闭的，同时，Nginx默认只对text/html进行压缩

gzip on;

ersio #开启gzip压缩输出

gzip_http_vn 1.0 ;#默认1.1

#其中的gzip_http_version的设置，它的默认值是1.1，就是说对HTTP/1.1协议的请求才会进行gzip压缩

#如果我们使用了proxy_pass进行反向代理，那么nginx和后端的upstream server之间是用HTTP/1.0协议通信的。

gzip_vary on ;

#和http头有关系，加个vary头，给代理服务器用的，有的浏览器支持压缩，有的不支持，

#所以避免浪费不支持的也压缩，所以根据客户端的HTTP头来判断，是否需要压缩

gzip_comp_level 6;

#设置gzip压缩等级，等级越底压缩速度越快文件压缩比越小，反之速度越慢文件压缩比越大 1-9

gzip_proxied any;

#Ngnix作为反向代理的时候启用

#expample:gzip_proxied no-cache;

# off – 关闭所有的代理结果数据压缩

# expired – 启用压缩，如果header中包含”Expires”头信息

# no-cache – 启用压缩，如果header中包含”Cache-Control:no-cache”头信息

# no-store – 启用压缩，如果header中包含”Cache-Control:no-store”头信息

# private – 启用压缩，如果header中包含”Cache-Control:private”头信息

# no_last_modified – 启用压缩，如果header中包含”Last_Modified”头信息

# no_etag – 启用压缩，如果header中包含“ETag”头信息

# auth – 启用压缩，如果header中包含“Authorization”头信息

# any – 无条件压缩所有结果数据

gzip_types text/html ;#压缩的文件类型

#设置需要压缩的MIME类型,非设置值不进行压缩

#param:text/html|application/x-javascript|text/css|application/xml

gzip_buffers 16 8k; #设置gzip申请内存的大小,其作用是按块大小的倍数申请内存空间设置gzip申请内存的大小,其作用是按块大小的倍数申请内存空间

#设置gzip申请内存的大小,其作用是按块大小的倍数申请内存空间

# param1:int 增加的倍数

# param2:int(k) 后面单位是k

# example: gzip_buffers 4 8k;

# Disable gzip for certain browsers.

gzip_disable “MSIE [1-6].(?!.*SV1)”; #ie6不支持gzip，需要禁用掉ie6

文件缓存服务器流程

与文件缓存服务器流程相关的内容