一、用戶訪問百度(www.baidu.com)
用戶訪問在url中輸入地址后,首先會訪問本地的緩存和hosts文件,如果沒有,會訪問本地DNS,在就是根域和頂級域名等,在前面已經說過了,這里不再贅述。
這里說明兩個:查看本地windows緩存: ipconfig /displaydns
hosts文件路徑:cmd下輸入window32,在就是drives/etc/hosts
二、http協議簡介
http是超文本傳輸協議,是互聯網上應用最為廣泛的一種網絡協議。所有的www都必須遵守這個標准,http除了www還有很多東西,網頁是www服務,但遵循http協議。http有很多應用,但著名的是Web瀏覽器和Web服務器之間的雙工通信。 所以http包含www,www使用http協議,網頁就是www服務。
www就是萬維網,默認端口使80,加密的是https 443
三、http協議請求頭查看:
1)wget 網址 2)curl -I 網址 (不加I表示內容的查看,加I表示還只查看請求頭信息)
四、動態web服務請求流程:
五、概念
1)靜態頁面:所有程序在客戶瀏覽器端解析,容易被搜索引擎收錄,客戶瀏覽器端解析程序,效率很高。
2)動態網頁:一般以數據庫技術為基礎,可以大大降低網站維護的工作量,動態網頁大多數並不是獨立存在與服務器上的網頁文件,只有當用戶請求時服務器才返回一個完整的網頁,效率很差,並發低,盡可能轉為靜態網頁。
3)偽靜態:就是動態變成靜態,便於搜索引擎收錄和提升用戶體驗。動態網頁偽靜態技術如:rewrite即url地址重寫等技術。
在速度方面:靜態:動態===》10:1
在架構中,盡可能使網頁為靜態的,這樣速度更快。高並發訪問的核心原其實就一句化:“把所有的用戶訪問請求都盡量往前推”。由於靜態程序在客戶端解析,大大降低了服務器端的壓力,因此解析效率更高,在實際高並發網站架構中,我們可以考慮把用戶請求的數據解析后存為靜態文件放在磁盤中或者內存中,來降低動態服務器的壓力,從而提升用戶體驗。
這里想說明的是,動態服務器中,異步的是消息中間件,消息隊列的應用。
六、靜態頁面的語言是靜態語言,核心一般是html語言,動態web語言有php,python等,需要在服務端解析。
例如php程序的經典組合架構:
lamp(linux apache mysql php) 在中小企業中應用非常廣泛。
lnmp(linux nginx mysql php) 在大型企業的首選,這里apache是老牌的企業軟件,而nginx是新生的代表,解析效率高些。
七、訪問模式:
訪問模式就是:
B/S:缺點:兼容性差 安全不好
C/S:缺點:適用性窄,維護成本高,升級一次,所有客戶端都要升級。
八、三個指標:
IP:獨立IP數,不同的IP地址的計算機訪問網站的總次數,是網站流量分析的一個重要指標,一天內相同IP地址被計算僅一次。
PV: 訪問量,頁面點擊量,從瀏覽器發出一個對網絡web服務器的請求,網絡web服務器接到這個請求后,會將該請求對應的一個網頁發送會客戶端瀏覽器。
UV: 獨立訪客,一個客戶端(pc、移動端)一天之內只算一次。(比如cookies)
九、什么是並發?如何理解並發?
單位時間內,服務器能夠處理的最大連接數,注意這里是單位時間,不是一秒,(有的請求1秒結束,有的可能是10秒結束),指的類似於吞吐量這個意思,仁者見仁,智者見智吧,也沒有決定正確的。
十、一個例子:處理以下文件內容,將域名取出並進行計數排序,如處理
http://www.etiantian.org/index.html
http://www.etiantian.org/1.html
http://post.etiantian.org/index.html
http://mp3.etiantian.org/index.html
http://www.etiantian.org/3.html
http://post.etiantian.org/2.html
解:這里給出兩種方法
1.uniq和sort的結合使用:uniq和sort結合使用,因為如果一組信息,相同部分的挨着,單獨用uniq是不去重的
uniq去重:-c表示計數
sort 對於文本的行進行排序 -n 按照數字排序 -r 倒序 -t 分隔符 -k 指定排序的列
[root@djw1 ~]# awk -F "/" '{print $3}' ceshi.txt |sort -rn|uniq -c
3 www.etiantian.org
2 post.etiantian.org
1 mp3.etiantian.org
2.awk庖丁解牛方法:
[root@djw1 ~]# awk -F "/" '{++S[$3]} END {for(key in S) print S[key],key}' ceshi.txt |sort -rn
3 www.etiantian.org
2 post.etiantian.org
1 mp3.etiantian.org
分析:此類問題是運維工作中最常見的問題。可以演變成分析日志,查看TCP各個狀態連接數,查看單IP連接數排名等等
完結!