Nginx 靜態文件服務
我們先來看看最簡單的本地靜態文件服務配置示例:
server {
listen 80;
server_name www.test.com;
charset utf-8;
root /data/www.test.com;
index index.html index.htm;
}
就這些?恩,就這些!如果只是提供簡單的對外靜態文件,它真的就可以用了。可是他不完美,遠遠沒有發揮 Nginx 的半成功力,為什么這么說呢,看看下面的配置吧,為了大家看着方便,我們把每一項的作用都做了注釋。
http {
# 這個將為打開文件指定緩存,默認是沒有啟用的,max 指定緩存數量,
# 建議和打開文件數一致,inactive 是指經過多長時間文件沒被請求后刪除緩存。
open_file_cache max=204800 inactive=20s;
# open_file_cache 指令中的inactive 參數時間內文件的最少使用次數,
# 如果超過這個數字,文件描述符一直是在緩存中打開的,如上例,如果有一個
# 文件在inactive 時間內一次沒被使用,它將被移除。
open_file_cache_min_uses 1;
# 這個是指多長時間檢查一次緩存的有效信息
open_file_cache_valid 30s;
# 默認情況下,Nginx的gzip壓縮是關閉的, gzip壓縮功能就是可以讓你節省不
# 少帶寬,但是會增加服務器CPU的開銷哦,Nginx默認只對text/html進行壓縮 ,
# 如果要對html之外的內容進行壓縮傳輸,我們需要手動來設置。
gzip on;
gzip_min_length 1k;
gzip_buffers 4 16k;
gzip_http_version 1.0;
gzip_comp_level 2;
gzip_types text/plain application/x-javascript text/css application/xml;
server {
listen 80;
server_name www.test.com;
charset utf-8;
root /data/www.test.com;
index index.html index.htm;
}
}
我們都知道,應用程序和網站一樣,其性能關乎生存。但如何使你的應用程序或者網站性能更好,並沒有一個明確的答案。代碼質量和架構是其中的一個原因,但是在很多例子中我們看到,你可以通過關注一些十分基礎的應用內容分發技術(basic application delivery techniques),來提高終端用戶的體驗。其中一個例子就是實現和調整應用棧(application stack)的緩存。
文件緩存漫談
一個 web 緩存坐落於客戶端和原始服務器(origin server)中間,它保留了所有可見內容的拷貝。如果一個客戶端請求的內容在緩存中存儲,則可以直接在緩存中獲得該內容而不需要與服務器通信。這樣一來,由於 web 緩存距離客戶端“更近”,就可以提高響應性能,並更有效率的使用應用服務器,因為服務器不用每次請求都進行頁面生成工作。
在瀏覽器和應用服務器之間,存在多種潛在緩存,如:客戶端瀏覽器緩存、中間緩存、內容分發網絡(CDN)和服務器上的負載平衡和反向代理。緩存,僅在反向代理和負載均衡的層面,就對性能提高有很大的幫助。
舉個例子說明,去年,我接手了一項任務,這項任務的內容是對一個加載緩慢的網站進行性能優化。首先引起我注意的事情是,這個網站差不多花費了超過 1 秒鍾才生成了主頁。經過一系列調試,我發現加載緩慢的原因在於頁面被標記為不可緩存,即為了響應每一個請求,頁面都是動態生成的。由於頁面本身並不需要經常性的變更,並且不涉及個性化,那么這樣做其實並沒有必要。為了驗證一下我的結論,我將頁面標記為每 5 秒緩存一次,僅僅做了這一個調整,就能明顯的感受到性能的提升。第一個字節到達的時間降低到幾毫秒,同時頁面的加載明顯要更快。
並不是只有大規模的內容分發網絡(CDN)可以在使用緩存中受益——緩存還可以提高負載平衡器、反向代理和應用服務器前端 web 服務的性能。通過上面的例子,我們看到,緩存內容結果,可以更高效的使用應用服務器,因為不需要每次都去做重復的頁面生成工作。此外,Web 緩存還可以用來提高網站可靠性。當服務器宕機或者繁忙時,比起返回錯誤信息給用戶,不如通過配置 Nginx 將已經緩存下來的內容發送給用戶。這意味着,網站在應用服務器或者數據庫故障的情況下,可以保持部分甚至全部的功能運轉。
下面討論如何安裝和配置 Nginx 的基礎緩存(Basic Caching)。
如何安裝和配置基礎緩存
我們只需要兩個命令就可以啟用基礎緩存:proxy_cache_path 和 proxy_cache。proxy_cache_path 用來設置緩存的路徑和配置,proxy_cache 用來啟用緩存。
proxy_cache_path/path/to/cache levels=1:2 keys_zone=my_cache:10m max_size=10g inactive=60m
use_temp_path=off;
server {
...
location / {
proxy_cache my_cache;
proxy_pass http://my_upstream;
}
}
proxy_cache_path 命令中的參數及對應配置說明如下:
- 用於緩存的本地磁盤目錄是 /path/to/cache/
- levels 在 /path/to/cache/ 設置了一個兩級層次結構的目錄。將大量的文件放置在單個目錄中會導致文件訪問緩慢,所以針對大多數部署,我們推薦使用兩級目錄層次結構。如果 levels 參數沒有配置,則 Nginx 會將所有的文件放到同一個目錄中。
- keys_zone 設置一個共享內存區,該內存區用於存儲緩存鍵和元數據,有些類似計時器的用途。將鍵的拷貝放入內存可以使 Nginx 在不檢索磁盤的情況下快速決定一個請求是
HIT
還是MISS
,這樣大大提高了檢索速度。一個 1MB 的內存空間可以存儲大約 8000 個 key,那么上面配置的 10MB 內存空間可以存儲差不多 80000 個 key。 - max_size 設置了緩存的上限(在上面的例子中是 10G)。這是一個可選項;如果不指定具體值,那就是允許緩存不斷增長,占用所有可用的磁盤空間。當緩存達到這個上限,處理器便調用 cache manager 來移除最近最少被使用的文件,這樣把緩存的空間降低至這個限制之下。
- inactive 指定了項目在不被訪問的情況下能夠在內存中保持的時間。在上面的例子中,如果一個文件在 60 分鍾之內沒有被請求,則緩存管理將會自動將其在內存中刪除,不管該文件是否過期。該參數默認值為 10 分鍾(10m)。注意,非活動內容有別於過期內容。Nginx 不會自動刪除由緩存控制頭部指定的過期內容(本例中 Cache-Control:max-age=120)。過期內容只有在 inactive 指定時間內沒有被訪問的情況下才會被刪除。如果過期內容被訪問了,那么 Nginx 就會將其從原服務器上刷新,並更新對應的 inactive 計時器。
- Nginx 最初會將注定寫入緩存的文件先放入一個臨時存儲區域,use_temp_path=off 命令指示 Nginx 將在緩存這些文件時將它們寫入同一個目錄下。我們強烈建議你將參數設置為 off 來避免在文件系統中不必要的數據拷貝。use_temp_path 在 Nginx 1.7 版本和 Nginx Plus R6 中有所介紹。
最終,proxy_cache 命令啟動緩存那些 URL 與 location 部分匹配的內容(本例中,為 /
)。你同樣可以將 proxy_cache 命令添加到 server 部分,這將會將緩存應用到所有的那些 location 中未指定自己的 proxy_cache 命令的服務中。
陳舊總比沒有強
Nginx 內容緩存的一個非常強大的特性是:當無法從原始服務器獲取最新的內容時,Nginx 可以分發緩存中的陳舊(stale,編者注:即過期內容)內容。這種情況一般發生在關聯緩存內容的原始服務器宕機或者繁忙時。比起對客戶端傳達錯誤信息,Nginx 可發送在其內存中的陳舊的文件。Nginx 的這種代理方式,為服務器提供額外級別的容錯能力,並確保了在服務器故障或流量峰值的情況下的正常運行。為了開啟該功能,只需要添加 proxy_cache_use_stale 命令即可:
location / {
...
proxy_cache_use_stale error timeout http_500 http_502 http_503 http_504;
}
按照上面例子中的配置,當 Nginx 收到服務器返回的 error,timeout 或者其他指定的 5xx 錯誤,並且在其緩存中有請求文件的陳舊版本,則會將這些陳舊版本的文件而不是錯誤信息發送給客戶端。
緩存微調
Nginx 提供了豐富的可選項配置用於緩存性能的微調。下面是使用了幾個配置的例子:
proxy_cache_path /path/to/cache levels=1:2 keys_zone=my_cache:10m max_size=10g inactive=60m
use_temp_path=off;
server {
...
location / {
proxy_cache my_cache;
proxy_cache_revalidate on;
proxy_cache_min_uses 3;
proxy_cache_use_stale error timeout updating http_500 http_502 http_503 http_504;
proxy_cache_lock on;
proxy_pass http://my_upstream;
}
}
這些命令配置了下列的行為:
- proxy_cache_revalidate 指示 Nginx 在刷新來自服務器的內容時使用 GET 請求。如果客戶端的請求項已經被緩存過了,但是在緩存控制頭部中定義為過期,那么 Nginx 就會在 GET 請求中包含 If-Modified-Since 字段,發送至服務器端。這項配置可以節約帶寬,因為對於 Nginx 已經緩存過的文件,服務器只會在該文件請求頭中 Last-Modified 記錄的時間內被修改時才將全部文件一起發送。
- proxy_cache_min_uses 該指令設置同一鏈接請求達到幾次即被緩存,默認值為 1 。當緩存不斷被填滿時,這項設置便十分有用,因為這確保了只有那些被經常訪問的內容會被緩存。
- proxy_cache_use_stale 中的 updating 參數告知 Nginx 在客戶端請求的項目的更新正在原服務器中下載時發送舊內容,而不是向服務器轉發重復的請求。第一個請求陳舊文件的用戶不得不等待文件在原服務器中更新完畢。陳舊的文件會返回給隨后的請求直到更新后的文件被全部下載。
- 當 proxy_cache_lock 被啟用時,當多個客戶端請求一個緩存中不存在的文件(或稱之為一個 MISS),只有這些請求中的第一個被允許發送至服務器。其他請求在第一個請求得到滿意結果之后在緩存中得到文件。如果不啟用 proxy_cache_lock,則所有在緩存中找不到文件的請求都會直接與服務器通信。
跨多硬盤分割緩存
使用 Nginx 不需要建立一個 RAID(磁盤陣列)。如果有多個硬盤,Nginx 可以用來在多個硬盤之間分割緩存。下面是一個基於請求 URI 跨越兩個硬盤之間均分緩存的例子:
proxy_cache_path /path/to/hdd1 levels=1:2 keys_zone=my_cache_hdd1:10m max_size=10g
inactive=60m use_temp_path=off;
proxy_cache_path /path/to/hdd2 levels=1:2 keys_zone=my_cache_hdd2:10m max_size=10g inactive=60m use_temp_path=off;
split_clients $request_uri $my_cache {
50% "my_cache_hdd1";
50% "my_cache_hdd2";
}
server {
...
location / {
proxy_cache $my_cache;
proxy_pass http://my_upstream;
}
}