1.nginx負載均衡
網站的訪問量越來越大,服務器的服務模式也得進行相應的升級,比如分離出數據庫服務器、分離出圖片作為單獨服務,這些是簡單的數據的負載均衡,將壓力分散到不同的機器上。有時候來自web前端的壓力,也能讓人十分頭痛。怎樣將同一個域名的訪問分散到兩台或更多的機器上呢?這其實就是另一種負載均衡了,nginx自身就可以做到,只需要做個簡單的配置就行。
nginx不單可以作為強大的web服務器,也可以作為一個反向代理服務器,而且nginx還可以按照調度規則實現動態、靜態頁面的分離,可以按照輪詢、ip哈希、URL哈希、權重等多種方式對后端服務器做負載均衡,同時還支持后端服務器的健康檢查。
Nginx負載均衡一些基礎知識:
nginx 的 upstream目前支持 4 種方式的分配
1)、輪詢(默認)
每個請求按時間順序逐一分配到不同的后端服務器,如果后端服務器down掉,能自動剔除。
2)、weight
指定輪詢幾率,weight和訪問比率成正比,用於后端服務器性能不均的情況。
2)、ip_hash
每個請求按訪問ip的hash結果分配,這樣每個訪客固定訪問一個后端服務器,可以解決session的問題。
3)、fair(第三方)
按后端服務器的響應時間來分配請求,響應時間短的優先分配。
4)、url_hash(第三方)
2.nginx負載均衡配置,主要是proxy_pass,upstream的使用
在http段做如下配置,即可實現兩個域名
upstream www.linuxidc.com
{
server 10.0.1.50:8080;
server 10.0.1.51:8080;
}
upstream blog.linuxidc.com
{
server 10.0.1.50:8080;
server 10.0.1.51:8080;
}
server
{
listen 80;
server_name www.linuxidc.com;
location / {
proxy_pass http://www.linuxidc.com;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
}
}
server
{
listen 80;
server_name blog.linuxidc.com wode.linuxidc.com;
location / {
proxy_pass http://www.linuxidc.com;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
}
}
3.注意的幾個小問題
3.1 多台機器間session的共享問題
配置負載均衡比較簡單,但是最關鍵的一個問題是怎么實現多台服務器之間session的共享
下面有幾種方法(以下內容來源於網絡,第四種方法沒有實踐.)
1). 不使用session,換作cookie
能把session改成cookie,就能避開session的一些弊端,在從前看的一本J2EE的書上,也指明在集群系統中不能用session,否則惹出禍端來就不好辦。如果系統不復雜,就優先考慮能否將session去掉,改動起來非常麻煩的話,再用下面的辦法。
2). 應用服務器自行實現共享
php可以用數據庫或memcached來保存session,從而在php本身建立了一個session集群,用這樣的方式可以令 session保證穩定,即使某個節點有故障,session也不會丟失,適用於較為嚴格但請求量不高的場合。但是它的效率是不會很高的,不適用於對效率要求高的場合。
以上兩個辦法都跟nginx沒什么關系,下面來說說用nginx該如何處理:
3). ip_hash
nginx中的ip_hash技術能夠將某個ip的請求定向到同一台后端,這樣一來這個ip下的某個客戶端和某個后端就能建立起穩固的session,ip_hash是在upstream配置中定義的:
upstream backend {
server 127.0.0.1:8080 ;
server 127.0.0.1:9090 ;
ip_hash;
}
ip_hash是容易理解的,但是因為僅僅能用ip這個因子來分配后端,因此ip_hash是有缺陷的,不能在一些情況下使用:
nginx不是最前端的服務器。ip_hash要求nginx一定是最前端的服務器,否則nginx得不到正確ip,就不能根據ip作hash。譬如使用的是squid為最前端,那么nginx取ip時只能得到squid的服務器ip地址,用這個地址來作分流是肯定錯亂的。
nginx的后端還有其它方式的負載均衡。假如nginx后端又有其它負載均衡,將請求又通過另外的方式分流了,那么某個客戶端的請求肯定不能定位到同一台session應用服務器上。這么算起來,nginx后端只能直接指向應用服務器,或者再搭一個squid,然后指向應用服務器。最好的辦法是用location作一次分流,將需要session的部分請求通過ip_hash分流,剩下的走其它后端去。
4). upstream_hash
為了解決ip_hash的一些問題,可以使用upstream_hash這個第三方模塊,這個模塊多數情況下是用作url_hash的,但是並不妨礙將它用來做session共享。假如前端是squid,他會將ip加入x_forwarded_for這個http_header里,用upstream_hash可以用這個頭做因子,將請求定向到指定的后端:可見這篇文檔:http://www.sudone.com/nginx/nginx_url_hash.html
在文檔中是使用$request_uri做因子,稍微改一下:
hash $http_x_forwarded_for;
這樣就改成了利用x_forwarded_for這個頭作因子,在nginx新版本中可支持讀取cookie值,所以也可以改成:
hash $cookie_jsessionid;
假如在php中配置的session為無cookie方式,配合nginx自己的一個userid_module模塊就可以用nginx自發一個cookie,可參見userid模塊的英文文檔:http://wiki.nginx.org/NginxHttpUserIdModule
另可用姚偉斌編寫的模塊upstream_jvm_route:http://code.google.com/p/nginx-upstream-jvm-route/
3.2 后端服務器自動加上端口的問題
一個典型的 Nginx + Apache 應用方案可以是Nginx 占用 80 端口,過濾靜態請求,然后動態請求即 Proxy 到 Apache 的 8080 端口。Proxy 反向代理的好處是訪問的時候,始終就是 80端口,來訪者不會覺察到有任何的區別。但有的應用確非常“聰明”,識別到 Apache 所位於的端口是 8080 ,就會把相關的超鏈接都一並加上 :8080 的后續。這么就死定了,還能有正常訪問麽?!有個方法可以解決這事,就是把 apache 也運行在80端口上。同一台服務器,有Nginx 也有 Apache,2個httpd服務,都是80,不會沖突麽?
nginx.conf 的配置中
server {
listen 80;
server_name www.linuxidc.com;
....
}
修改為:
server {
listen 123.123.123.123:80; #指定Nginx只占用某個公網IP的80端口。
#listen 123.123.123.124:80; #如果你服務器中有多個IP,還可以指定多個。
server_name www.linuxidc.com;
....
}
把 apache 的配置文件 httpd.conf 中的
Listen 80
改為
Listen 127.0.0.1:80
跟Nginx一樣,指定apache所占用的IP及端口。
保存退出,重啟apache即可生效。