IO有四種類型:連續讀,隨機讀,隨機寫和連續寫,連續讀寫的IO size通常比較大(128KB-1MB),主要衡量吞吐量,而隨機讀寫的IO size比較小(小於8KB),主要衡量IOPS和響應時間。數據庫中的全表掃描是連續讀IO,索引訪問則是典型的隨機讀IO,日志文件是連續寫IO,而數據文件則是隨機寫IO。
數據庫系統基於傳統磁盤訪問特性來設計,最大特點是日志文件采用sequential logging,數據庫中的日志文件,要求必須在事務提交時寫入到磁盤,對響應時間的要求很高,所以設計為順序寫入的方式,可以有效降低磁盤尋道花費的時間,減少延遲時間。日志文件的順序寫入,雖然是物理位置是連續的,但是並不同於傳統的連續寫類型,日志文件的IO size很小(通常小於4K),每個IO之間是獨立的(磁頭必須抬起來重新尋道,並等待磁盤轉動到相應的位置),而且間隔很短,數據庫通過log buffer(緩存)和group commit的方式(批量提交)來達到提高IO size的大小,並減少IO的次數,從而得到更小的響應延遲,所以日志文件的順序寫入可以被認為是“連續位置的隨機寫入”,更關注IOPS,而不是吞吐量。
數據文件采用in place uddate的方式,意思是數據文件的修改都是寫入到原來的位置,數據文件不同於日志文件,並不會在事務commit時寫入數據文件,只有當數據庫發現dirty buffer過多或者需要做checkpoint動作時,才會刷新這些dirty buffer到相應的位置,這是一個異步的過程,通常情況下,數據文件的隨機寫入對IO的要求並不是特別高,只要滿足checkpoint和dirty buffer的要求就可以了。