通常所說的Web緩存指的是可以自動保存常見http請求副本的http設備。對於前端開發者來說,浏覽器充當了重要角色。除此外常見的還有各種各樣的代理服務器也可以做緩存。當Web請求到達緩存時,緩存從本地副本
中提取這個副本內容而不需要經過服務器。這帶來了以下優點:
緩存可以是單個用戶專用的,也可以是多個用戶共享的。專用緩存被稱為私有緩存
,共享的緩存被稱為公有緩存
。
私有緩存只針對專有用戶,所以不需要很大空間,廉價。Web浏覽器中有內建的私有緩存——大多數浏覽器都會將常用資源緩存在你的個人電腦的磁盤和內存中。如Chrome浏覽器的緩存存放位置就在:C:\Users\Your_Account\AppData\Local\Google\Chrome\User Data\Default
中的Cache文件夾和Media Cache文件夾。
公有緩存是特殊的共享代理服務器,被稱為緩存代理服務器
或代理緩存
(反向代理的一種用途)。公有緩存會接受來自多個用戶的訪問,所以通過它能夠更好的減少冗余流量。
下圖中每個客戶端都會重復的向服務器訪問一個資源(此時還不在私有緩存中),這樣它會多次訪問服務器,增加服務器壓力。而使用共享的公有緩存時,緩存只需要從服務器取一次,以後不用再經過服務器,能夠顯著減輕服務器壓力。
事實上在實際應用中通常采用層次化的公有緩存,基本思想是在靠近客戶端的地方使用小型廉價緩存,而更高層次中,則逐步采用更大、功能更強的緩存在裝載多用戶共享的資源。
而對於前端開發者來說,我們主要跟浏覽器中的緩存打交道,所以上圖流程簡化為:
下面這張圖展示了某一網站,對不同資源的請求結果,其中可以看到有的資源直接從緩存中讀取,有的資源跟服務器進行了再驗證,有的資源重新從服務器端獲取。
注意,我們討論的所有關於緩存資源的問題,都僅僅針對GET
請求。而對於POST
, DELETE
, PUT
這類行為性操作通常不做任何緩存
HTTP通過緩存將服務器資源的副本保留一段時間,這段時間稱為新鮮度限值
。這在一段時間內請求相同資源不會再通過服務器。HTTP協議中Cache-Control
和 Expires
可以用來設置新鮮度的限值,前者是HTTP1.1中新增的響應頭,後者是HTTP1.0中的響應頭。二者所做的事時都是相同的,但由於Cache-Control
使用的是相對時間,而Expires可能存在客戶端與服務器端時間不一樣的問題,所以我們更傾向於選擇Cache-Control
。
下面我們來看看Cache-Control
都可以設置哪些屬性值:
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" />
<meta http-equiv="X-UA-Compatible" content="IE=EDGE" />
<title>Web Cache</title>
<link rel="shortcut icon" href="./shortcut.png">
<script>
</script>
</head>
<body class="claro">
<img src="./cache.png">
</body>
</html>
var http = require('http');
var fs = require('fs');
http.createServer(function(req, res) {
if (req.url === '/' || req.url === '' || req.url === '/index.html') {
fs.readFile('./index.html', function(err, file) {
console.log(req.url)
//對主文檔設置緩存,無效果
res.setHeader('Cache-Control', "no-cache, max-age=" + 5);
res.setHeader('Content-Type', 'text/html');
res.writeHead('200', "OK");
res.end(file);
});
}
if (req.url === '/cache.png') {
fs.readFile('./cache.png', function(err, file) {
res.setHeader('Cache-Control', "max-age=" + 5);//緩存五秒
res.setHeader('Content-Type', 'images/png');
res.writeHead('200', "Not Modified");
res.end(file);
});
}
}).listen(8888)
當在5秒內第二次訪問頁面時,浏覽器會直接從緩存中取得資源
no-cache 表示必須先與服務器確認資源是否被更改過(依靠If-None-Match
和Etag
),然後再決定是否使用本地緩存。
如果上文中關於cache.png
的處理改成下面這樣,則每次訪問頁面,浏覽器都需要先去服務器端驗證資源有沒有被更改。
fs.readFile('./cache.png', function(err, file) {
console.log(req.headers);
console.log(req.url)
if (!req.headers['if-none-match']) {
res.setHeader('Cache-Control', "no-cache, max-age=" + 5);
res.setHeader('Content-Type', 'images/png');
res.setHeader('Etag', "ffff");
res.writeHead('200', "Not Modified");
res.end(file);
} else {
if (req.headers['if-none-match'] === 'ffff') {
res.writeHead('304', "Not Modified");
res.end();
} else {
res.setHeader('Cache-Control', "max-age=" + 5);
res.setHeader('Content-Type', 'images/png');
res.setHeader('Etag', "ffff");
res.writeHead('200', "Not Modified");
res.end(file);
}
}
});
no-store 絕對禁止緩存任何資源,也就是說每次用戶請求資源時,都會向服務器發送一個請求,每次都會下載完整的資源。通常用於機密性資源。
關於Cache-Control
的使用,見下面這張圖(來自大額)
Cache-Control
不僅僅可以在響應頭中設置,還可以在請求頭中設置。浏覽器通過請求頭中設置Cache-Control
可以決定是否從緩存中讀取資源。這也是為什麼有時候點擊浏覽器刷新按鈕和在地址欄回車,在NetWork模塊中看到完全不同的結果
不推薦使用Expires,它指定的是具體的過期日期而不是秒數。因為很多服務器跟客戶端存在時鐘不一致的情況,所以最好還是使用Cache-Control
.
浏覽器或代理緩存中緩存的資源過期了,並不意味著它和原始服務器上的資源有實際的差異,僅僅意味著到了要進行核對的時間了。這種情況被稱為服務器再驗證。
If-None-Match
/Etag
,在HTTP1.0中則使用If-Modified-Since
/Last-Modified
。根據實體內容生成一段hash字符串,標識資源的狀態,由服務端產生。浏覽器會將這串字符串傳回服務器,驗證資源是否已經修改,如果沒有修改,過程如下(圖片來自淺談Web緩存):
上文的demo中我們見到過服務器端如何驗證Etag:
由於Etag有服務器構造,所以在集群環境中一定要保證Etag的唯一性
這兩個是HTTP1.0中用來驗證資源是否過期的請求/響應頭,這兩個頭部都是日期,驗證過程與Etag
類似,這裡不詳細介紹。使用這兩個頭部來驗證資源是否更新時,存在以下問題:
If-Modified-Since
不相同,導致不必要的響應。關於緩存的更新問題,請大家看看這裡張雲龍的回答,本文就不詳細展開了。
本文demo代碼如下:
<!DOCTYPE HTML>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" />
<meta http-equiv="X-UA-Compatible" content="IE=EDGE" />
<title>Web Cache</title>
<link rel="shortcut icon" href="./shortcut.png">
<script>
</script>
</head>
<body class="claro">
<img src="./cache.png">
</body>
</html>
var http = require('http');
var fs = require('fs');
http.createServer(function(req, res) {
if (req.url === '/' || req.url === '' || req.url === '/index.html') {
fs.readFile('./index.html', function(err, file) {
console.log(req.url)
//對主文檔設置緩存,無效果
res.setHeader('Cache-Control', "no-cache, max-age=" + 5);
res.setHeader('Content-Type', 'text/html');
res.writeHead('200', "OK");
res.end(file);
});
}
if (req.url === '/shortcut.png') {
fs.readFile('./shortcut.png', function(err, file) {
console.log(req.url)
res.setHeader('Content-Type', 'images/png');
res.writeHead('200', "OK");
res.end(file);
})
}
if (req.url === '/cache.png') {
fs.readFile('./cache.png', function(err, file) {
console.log(req.headers);
console.log(req.url)
if (!req.headers['if-none-match']) {
res.setHeader('Cache-Control', "max-age=" + 5);
res.setHeader('Content-Type', 'images/png');
res.setHeader('Etag', "ffff");
res.writeHead('200', "Not Modified");
res.end(file);
} else {
if (req.headers['if-none-match'] === 'ffff') {
res.writeHead('304', "Not Modified");
res.end();
} else {
res.setHeader('Cache-Control', "max-age=" + 5);
res.setHeader('Content-Type', 'images/png');
res.setHeader('Etag', "ffff");
res.writeHead('200', "Not Modified");
res.end(file);
}
}
});
}
}).listen(8888)