作者:liyihongcug
轉載地址:http://bbs.chinaunix.net/archiver/tid-1823500.html
解決一個 MySQL 服務器進程 CPU 占用 100%解決一個 MySQL 服務器進程 CPU 占用 100%的技術筆記》( [url]http://www.xiaohui.com/weekly/20070307.htm[/url] ),談到自己在解決一個擁有 60 萬條記錄的 MySQL 數據庫訪問時,導致 MySQL CPU 占用 100% 的經過。在解決問題完成優化(optimize)之后,我發現 Discuz 論壇也存在這個問題,當時稍微提了一下:
[url]http://www.xiaohui.com/dev/server/20070701-discuz-mysql-cpu-100-optimize.htm[/url]
發現此主機運行了幾個 Discuz 的論壇程序, Discuz論壇的好幾個表也存在着這個問題。於是順手一並解決,cpu占用再次降下來了。
前幾天,一位朋友通過這篇文章找到了我,說他就是運行最新的 discuz 版本,MySQL 占用 CPU 100%,導致系統假死,每天都要重啟好幾次,花了一個多月的時間一直沒有解決,希望我幫忙一下。經過檢查,他的這個論壇最重要的幾個表中,目前 cdb_members 表,有記錄 6.2 萬;cdb_threads 表,有記錄 11萬;cdb_posts表,有記錄 1740 萬;所有數據表的記錄加起來,超過 2000 萬;數據庫的大小超過 1GB。經過半天的調試,總算完成了 discuz 論壇優化,於是將其解決經過記錄在這篇文章 [url]http://www.xiaohui.com/dev/server/20070701-discuz-mysql-cpu-100-optimize.htm[/url] 中。
2007年3月我發現 discuz 論壇的數據庫結構設計有一些疏忽,有許多查詢子句的條件比較,都沒有建立 Index 索引。當時我所檢查的那個數據表,記錄只有幾千條,因此對 CPU 負荷不大。現在這個數據庫表,上千萬的記錄檢索,可以想象,如果數據表結構設計不規范,沒有提供索引,所耗費的時間是一個恐怖的數字。有關 MySQL 建立索引的重要性,可以參見我的這篇文章底部的說明:[url]http://www.xiaohui.com/weekly /20070307.htm[/url]
為了調試方便,我從 dizcus 的官網下載了其最新的 Dizcus! 5.5.0 論壇程序.
我首先檢查了 my.ini 的參數配置,一切正常。進入 MySQL 的命令行,調用 show processlist 語句,查找負荷最重的 SQL 語句,結合 Discuz 論壇的源碼,發現有以下語句導致 CPU 上升:
mysql> show processlist;
+-----+------+----------------+---------+---------+------+------------+---------
-----------------------------------------------------------------+
| Id | User | Host | db | Command | Time | State | Info
|
+-----+------+----------------+---------+---------+------+------------+---------
-----------------------------------------------------------------+
| 363 | root | localhost:1393 | history | Query | 0 | statistics | SELECT C
OUNT(*) FROM cdb_pms WHERE msgfromid=11212 AND folder='outbox' |
+-----+------+----------------+---------+---------+------+------------+---------
檢查 cdb_pms 表的結構:
mysql> show columns from cdb_pms;
+-----------+------------------------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra |
+-----------+------------------------+------+-----+---------+----------------+
| pmid | int(10) unsigned | NO | PRI | NULL | auto_increment |
| msgfrom | varchar(15) | NO | | | |
| msgfromid | mediumint(8) unsigned | NO | MUL | 0 | |
| msgtoid | mediumint(8) unsigned | NO | MUL | 0 | |
| folder | enum('inbox','outbox') | NO | | inbox | |
| new | tinyint(1) | NO | | 0 | |
| subject | varchar(75) | NO | | | |
| dateline | int(10) unsigned | NO | | 0 | |
| message | text | NO | | | |
| delstatus | tinyint(1) unsigned | NO | | 0 | |
+-----------+------------------------+------+-----+---------+----------------+
10 rows in set (0.00 sec)
這條語句: WHERE msgfromid=11212 AND folder='outbox',我們看到,在 cdb_pms 表中,msgfromid 字段已經建立了索引,但是,folder 字段並沒有。目前這個表已經有記錄 7823 條。顯然,這會對查詢造成一定影響。於是為其建立索引:
mysql> ALTER TABLE `cdb_pms` ADD INDEX ( `folder` );
Query OK, 7823 rows affected (1.05 sec)
Records: 7823 Duplicates: 0 Warnings: 0
繼續檢查:
mysql> show processlist;
+------+------+----------------+---------+---------+------+------------+--------
--------------------------------------------------------------------------------
--------------+
| Id | User | Host | db | Command | Time | State | Info
|
+------+------+----------------+---------+---------+------+------------+--------
--------------------------------------------------------------------------------
--------------+
|
| 1583 | root | localhost:2616 | history | Query | 0 | statistics | SELECT
t.tid, t.closed, f.*, ff.* , f.fid AS fid
FROM cdb_threads t
INNER JOIN cdb_forums f |
+------+------+----------------+---------+---------+------+------------+--------
--------------------------------------------------------------------------------
--------------+
1 rows in set (0.00 sec)
這條 SQL 語句是針對最重要的數據表 cdb_threads 進行操作的,由於 show processlist 沒有將這條 SQL 語句全部顯示完全,經對比 Discuz 論壇的源碼,此SQL語句的原型位於 common.inc.php 的 Line 283,內容如下:
$query = $db->query("SELECT t.tid, t.closed,".(defined('SQL_ADD_THREAD') ?
SQL_ADD_THREAD : '')." f.*, ff.* $accessadd1 $modadd1, f.fid AS fid
FROM {$tablepre}threads t
INNER JOIN {$tablepre}forums f ON f.fid=t.fid
LEFT JOIN {$tablepre}forumfields ff ON ff.fid=f.fid $accessadd2 $modadd2
WHERE t.tid='$tid'".($auditstatuson ? '' : " AND t.displayorder>=0")." LIMIT 1");
經檢查,數據表 cdb_threads, 並沒有針對 displayorder 字段建立索引。在 discuz 論壇中,displayorder字段多次參與了 Where 子句的比較。於是為其建立索引:
mysql> ALTER TABLE `cdb_threads` ADD INDEX ( `displayorder` );
Query OK, 110330 rows affected (2.36 sec)
Records: 110330 Duplicates: 0 Warnings: 0
此時 cpu 已經輕微下降了一部分。
繼續檢查,發現 下面這條 discuz 的 SQL 語句,也導致負荷增加,這條語句位於 rss.php 程序中的第 142 行。
$query = $db->query("SELECT t.tid, t.readperm, t.price, t.author, t.dateline, t.subject, p.message
FROM {$tablepre}threads t
LEFT JOIN {$tablepre}posts p ON p.tid=t.tid AND p.first=1
WHERE t.fid='$fid' AND t.displayorder>=0
ORDER BY t.dateline DESC LIMIT $num");
在這個 Order by 子句中,用到了 cdb_threads 表中的 dataline 字段。這個字段是用來存儲 unixtime 的時間戳,在整個論壇程序中,大部分時候數據的排序也是基於這個字段,竟然沒有建立索引。於是加上:
mysql> ALTER TABLE `cdb_threads` ADD INDEX ( `dateline` );
Query OK, 110330 rows affected (12.27 sec)
Records: 110330 Duplicates: 0 Warnings: 0
查找占用 CPU 高負茶的 SQL 語句,是一件麻煩而又枯燥的事,需要一條一條排除、分析。后面的工作,都是依此類推,經過檢查,共查出有八處地方,需要增加索引,如果你也碰到了 discuz 5.5.0 論壇導致 cpu 占用 100% 的情況,可以直接將下列語句復制過去,在 mysql 的命令行下執行即可:
ALTER TABLE `cdb_pms` ADD INDEX ( `folder` );
ALTER TABLE `cdb_threads` ADD INDEX ( `displayorder` );
ALTER TABLE `cdb_threads` ADD INDEX ( `dateline` );
ALTER TABLE `cdb_threads` ADD INDEX ( `closed` );
ALTER TABLE `cdb_threadsmod` ADD INDEX ( `dateline` );
ALTER TABLE `cdb_sessions` ADD INDEX ( `invisible` );
ALTER TABLE `cdb_forums` ADD INDEX ( `type` );
ALTER TABLE `cdb_forums` ADD INDEX ( `displayorder` );
注意:“cdb_” 是 discuz 論壇的默認數據表前綴。如果你的表名前綴不是 “cdb_”,則應該改成你對應的表名。例如:my_threads, my_pms 等等。
完成這些結構的優化之后,整個系統的 CPU 負荷在 10%~20%左右震盪,問題解決。
我很奇怪,設計數據庫結構,是一個數據庫開發人員的基本功,discuz 論壇好歹也是一個發展了有六七年的論壇了,為何數據庫結構設計得如此糟糕?我想也許有如下三個原因:
數據庫開發人員設計時本身的疏忽
故意留下的缺陷,當普通論壇沒有上數量級的記錄時,不會感覺到這個問題,當數據量增大(例如千萬級),此問題突現,以便針對用戶提供個**收取服務費.呵呵,估且以最大的惡意來猜測此事,玩笑而已,不必當真。:)
另一個可能就是用戶的論壇是從低版本升級而來,程序升了級,但數據結構也許沒有做相應的更新
附1: 補充筆記 2007-07-09
今天查看網站日志的 reffer, 發現在 discuz 的官方論壇上,有人就此文引起了一些爭論: [url]http://www.discuz.net/thread-673887-1-1.html[/url]。discuz 的管理員和管理員有如下言論:
引用自 cnteacher:
恰恰相反,discuz 的優化措施和數據庫的索引是按照大規模論壇設計的。
TO 一樓:數據庫結構的設計都是按照程序應用來進行的,使用任何非Discuz! 標准版本以外的代碼和程序,或者變更標准數據結構,均可能遇到不可預知的各種問題。
引用自 童虎:
你們可以看看xxxxx, xxxx之類的比較大型的網站,這種網站使用dz論壇都沒有問題,說明dz標准程序是沒有問題,出現樓主說的情況,多半屬於服務器或者安裝一些插件造成的
顯然將問題推給插件的原因是不正確的.舉個簡單的例子:在最新的 discuz 5.5.0 forumdisplay.php 第183 行,有如下語句:
$query = $db->query("SELECT uid, groupid, username, invisible,
lastactivity, action FROM {$tablepre}sessions
WHERE $guestwhere fid='$fid' AND invisible=0");
這里的 invisible 並沒有建立索引。本文中有評論認為 session 表是內存表, 速度會很快。理論是如此。不過我在 show processlist 中,觀察到上面這條語句占用了大量 CPU, 所以也將其一並加上了 index。cdb_threads 中的 closed 等字段, 也多次參與 where 運算, 也沒有建立索引。這些運算的語句, 是 discuz 自己的程序中的。
附2: 補充筆記 2007-11-11
自從這篇筆記發表以來,在我的這篇文章的評論、以及我的聯系消息中,就經常收到許多下面兩種類型的評論和郵件:一、許多技術人員批評我胡說八道、 Dizcus 論壇不需要做優化或者不能亂建索引的;二、許多使用Dizcus 的站長找我“冰天雪地裸體跪求”解決他們的 CPU 占用 100% 的問題。
一、關於 MySQL 數據庫優化技術上的爭論,我的觀點再次聲明如下:
技術上的爭論是可以放開了討論的。而我的水平也確實只是半瓶水,對數據庫的理論知識也只懂這么點,牛牛們的批評,我虛心接心,非常感謝。但是,評論里的批評不要上升到人身攻擊,否則,我的地盤我作主,直接刪除。
數據庫的優化,要涉及到的方方面面很多。關說理論是沒有用的,得靠事實說話。一個千萬級數據庫的實例優化說明不了問題,兩個千萬級的數據庫優化也許還說明 不了問題,但我相信,三個、四個、五個總是可以說明問題的,--截止到 2007.11.09,我已經幫助朋友優化過五個記錄數超過 1000 萬的 discuz 論壇了。我想事實勝於雄辯:優化之前,cpu 都是 100%;優化之后,cpu 降到 30%~40% 左右。沒錯,做 ADD INDEX 會增加數據庫 INSERT/UPDATE 時的開銷,但別忘了論壇最主要的操作,是 SELECT 查詢。
二、關於找我幫忙解決數據庫優化的評論和郵件,答復如下:
數據庫的優化,不同的版本有不同的實際情況,優化一個 database,短則三兩小時,慢則半天一天。請大家理解這個中年老男人養家的壓力,我的精力有限,不可能一一幫到。
對於沒有收入的個人網站,我可以在周六周日的空余時間內幫忙。請事先與我聯系好。
對於有收入的網站,嗯嗯,自覺點,請帶價格與我聯系,或者直接安排美女請我吃飯,否則免談。:) 請不要來信問“優化我們這個論壇你要多少費用?”這樣沒營養的話,而是直接說“幫我們優化 XXXX 論壇, XXXX RMB 可以不?”,我覺得合適就做。大家都很忙,我的時間很值錢,你要我自己報價,我怕嚇着你。
請通過 [url]http://www.xiaohui.com/support/[/url] 與我聯系。不要在評論里留個 QQ 號然后要我加你,我不會時時盯着評論看。
附3: 補充筆記 2007-11-17: 關於裝有首頁四格插件的 dz 論壇導致 MySQL 占用 大量CPU 的分析
今天手機巴士的站長( [url]http://bbs.sj84.com[/url] )找到我,他的基於 Discuz 的論壇,也存在 CPU 占用 100% 的問題,服務器從 Win 2003 換到 CentOS,內存 2G, CPU 1.86G, 數據:cdb_threads 4 萬,cdb_posts 96 萬,cdb_members 35 萬,已經按我上面文章所說的優化過索引。按說這個配置足夠運行論壇了,但問題一直得不到解決。
經過調試,將慢查詢的結果 dump 到 /usr/local/mysql/var/localhost-slow.log,運行 /usr/local/mysql/bin/mysqldumpslow /usr/local/mysql/var/localhost-slow.log 查看,結合 show processlist 命令,發現慢查詢集中在下列語句:
SELECT t.*, f.name FROM cdb_threads t, cdb_forums f WHERE
t.fid<>'S'
AND f.fid=t.fid
AND f.fid NOT IN (N,N,N,N)
AND t.closed NOT LIKE 'S'
AND t.replies !=N
AND t.displayorder>=N
ORDER BY t.views DESC LIMIT N, N
然而搜索 Dizcus 論壇的源碼,並沒有找到這行代碼。懷疑是插件的原因。經查,論壇裝了首頁四格的插件,這行語句位於 include/toplist.php 中: 仔細檢查這行代碼,發現存在許多性能或語法規范上的問題:
AND t.closed NOT LIKE 'S':t.closed 是數值字段,不應該用 LIKE 'S' 的形式參與比較。
ORDER BY t.views: t.views 在 dizcus 的原始數據表中,是沒有做索引的。
SELECT t.*: 這種寫法,是不被推薦的。如果要選擇某個表內的所有字段,最好是按實全部寫出來,例如:select t.aa, t.bb, t.cc, t.dd, ...
WHERE t.fid <> 'S': t.fid 是數值型字段,不應該寫成 字符比較的形式。這個對性能影響不大,是個編程規范的問題。
....
toplist.php 的其他三條 sql 語句,都存在這些問題。如果要針對他的 sql 語句去優化 MySQL 結構,會帶來不良的后果;如果直接改他的 toplist.php 程序,如果站長以后升級 toplist.php 又怕帶來不兼容問題。於是我建議他干脆關閉首頁四格插件。
關閉首頁四格插件之后,CPU 降到 18% 左右震盪,表現非常良好。
如果是我來寫首頁四格的程序,我不會采用這種方案,我會用定時15分鍾或30分鍾查詢一次數據庫,將結果寫入 TXT 文件或臨時表,然后程序再從中讀取,效率會高許多。
結論:
如果裝了插件的論壇碰到 CPU 高負荷時,建議關掉插件再評估性能。
慎裝第三方插件。沒事不要亂插。:)
附4:補充筆記 2008-06-10:這篇文章,重要的是分析過程,而不是進行修正的那段代碼
最近有幾位在評論中留言,以及給我 EMAIL,說到將我在文中給出的 那8行 ALTER TABLE 代碼,在他的出現 CPU 100% 的 dz 論壇上,用了之后沒有效果。
我的解釋如下:這段代碼,不能保證在 dz 的所有版本下通用。具體問題,要具體分析。這段代碼,是我在 Dizcus! 5.5.0 的版本的基本下進行分析得出的校正結果。其他的版本,不敢保證。
這篇文章的重點,並不是作為結果的這段代碼,而是如何得出這個結果的分析過程。知道了原理,你自己一樣可以分析。
附5: 相關文章:
解決一個 MySQL 服務器進程 CPU 占用 100%的技術筆記
liyihongcug 發表於 2011-08-17 21:06
[i=s] 本帖最后由 liyihongcug 於 2011-08-17 21:08 編輯 [/i]
[url]http://www.cnkuai.cn/news/20092/639.htm[/url]
[url]http://lgcpeter.iteye.com/blog/210461[/url]早上幫朋友一台服務器解決了 Mysql cpu 占用 100% 的問題,稍整理如下,希望對各位有所幫助。
朋友主機(Windows 2003 + IIS + PHP + MYSQL )近來 MySQL 服務進程 (mysqld-nt.exe) CPU 占用率總為 100% 高居不下。此主機有10個左右的 database, 分別給十個網站調用。據朋友測試,導致 mysqld-nt.exe cpu 占用奇高的是網站A,一旦在 IIS 中將此網站停止服務,CPU 占用就降下來了。一啟用,則馬上上升。
MYSQL CPU 占用 100% 的解決過程
今天早上仔細檢查了一下。目前此網站的七日平均日 IP 為2000,PageView 為 3萬左右。網站A 用的 database 目前有39個表,記錄數 60.1萬條,占空間 45MB。按這個數據,MySQL 不可能占用這么高的資源。
於是在服務器上運行命令,將 mysql 當前的環境變量輸出到文件 output.txt:
d:\web\mysql> mysqld.exe --help >output.txt
發現 tmp_table_size 的值是默認的 32M,於是修改 My.ini, 將 tmp_table_size 賦值到 200M:
d:\web\mysql> notepad c:\windows\my.ini [mysqld] tmp_table_size=200M
然后重啟 MySQL 服務。CPU 占用有輕微下降,以前的CPU 占用波形圖是 100% 一根直線,現在則在 97%~100%之間起伏。這表明調整 tmp_table_size 參數對 MYSQL 性能提升有改善作用。但問題還沒有完全解決。
於是進入 mysql 的 shell 命令行,調用 show processlist, 查看當前 mysql 使用頻繁的 sql 語句:
mysql> show processlist;
反復調用此命令(每秒刷兩次),發現網站 A 的兩個 SQL 語句經常在 process list 中出現,其語法如下:
SELECT t1.pid, t2.userid, t3.count, t1.date FROM _mydata AS t1 LEFT JOIN _myuser AS t3 ON t1.userid=t3.userid LEFT JOIN _mydata_body AS t2 ON t1.pid=t3.pid ORDER BY t1.pid LIMIT 0,15
調用 show columns 檢查這三個表的結構 :
mysql> show columns from _myuser; mysql> show columns from _mydata; mysql> show columns from _mydata_body;
終於發現了問題所在:_mydata 表,只根據 pid 建立了一個 primary key,但並沒有為 userid 建立索引。而在這個 SQL 語句的第一個 LEFT JOIN ON 子句中:
LEFT JOIN _myuser AS t3 ON t1.userid=t3.userid
_mydata 的 userid 被參與了條件比較運算。於是我為給 _mydata 表根據字段 userid 建立了一個索引:
mysql> ALTER TABLE `_mydata` ADD INDEX ( `userid` )
建立此索引之后,CPU 馬上降到了 80% 左右。看到找到了問題所在,於是檢查另一個反復出現在 show processlist 中的 sql 語句:
SELECT COUNT(*) FROM _mydata AS t1, _mydata_key AS t2 WHERE t1.pid=t2.pid and t2.keywords = '孔雀'
經檢查 _mydata_key 表的結構,發現它只為 pid 建了了 primary key, 沒有為 keywords 建立 index。_mydata_key 目前有 33 萬條記錄,在沒有索引的情況下對33萬條記錄進行文本檢索匹配,不耗費大量的 cpu 時間才怪。看來就是針對這個表的檢索出問題了。於是同樣為 _mydata_key 表根據字段 keywords 加上索引:
mysql> ALTER TABLE `_mydata_key` ADD INDEX ( `keywords` )
建立此索引之后,CPU立刻降了下來,在 50%~70%之間震盪。
再次調用 show prosslist,網站A 的sql 調用就很少出現在結果列表中了。但發現此主機運行了幾個 Discuz 的論壇程序, Discuz論壇的好幾個表也存在着這個問題。於是順手一並解決,cpu占用再次降下來了。
至此,問題解決。
解決 MYSQL CPU 占用 100% 的經驗總結
1. 增加 tmp_table_size 值。mysql 的配置文件中,tmp_table_size 的默認大小是 32M。如果一張臨時表超出該大小,MySQL產生一個 The table tbl_name is full 形式的錯誤,如果你做很多高級 GROUP BY 查詢,增加 tmp_table_size 值。 這是 mysql 官方關於此選項的解釋:
tmp_table_size
This variable determines the maximum size for a temporary table in memory. If the table becomes too large, a MYISAM table is created on disk. Try to avoid temporary tables by optimizing the queries where possible, but where this is not possible, try to ensure temporary tables are always stored in memory. Watching the processlist for queries with temporary tables that take too long to resolve can give you an early warning that tmp_table_size needs to be upped. Be aware that memory is also allocated per-thread. An example where upping this worked for more was a server where I upped this from 32MB (the default) to 64MB with immediate effect. The quicker resolution of queries resulted in less threads being active at any one time, with all-round benefits for the server, and available memory.
2. 對 WHERE, JOIN, MAX(), MIN(), ORDER BY 等子句中的條件判斷中用到的字段,應該根據其建立索引 INDEX。
索引被用來快速找出在一個列上用一特定值的行。沒有索引,MySQL不得不首先以第一條記錄開始並然后讀完整個表直到它找出相關的行。表越大,花費時間越 多。如果表對於查詢的列有一個索引,MySQL能快速到達一個位置去搜尋到數據文件的中間,沒有必要考慮所有數據。如果一個表有1000行,這比順序讀取 至少快100倍。所有的MySQL索引(PRIMARY、UNIQUE和INDEX)在B樹中存儲。
根據 mysql 的開發文檔:
索引 index 用於:
o 快速找出匹配一個WHERE子句的行
o 當執行聯結(JOIN)時,從其他表檢索行。
o 對特定的索引列找出MAX()或MIN()值
o 如果排序或分組在一個可用鍵的最左面前綴上進行(例如,ORDER BY key_part_1,key_part_2),排序或分組一個表。如果所有鍵值部分跟隨DESC,鍵以倒序被讀取。
o 在一些情況中,一個查詢能被優化來檢索值,不用咨詢數據文件。如果對某些表的所有使用的列是數字型的並且構成某些鍵的最左面前綴,為了更快,值可以從索引樹被檢索出來。
假定你發出下列SELECT語句:
mysql> SELECT * FROM tbl_name WHERE col1=val1 AND col2=val2;
如果一個多列索引存在於col1和col2上,適當的行可以直接被取出。如果分開的單行列索引存在於col1和col2上,優化器試圖通過決定哪個索引將找到更少的行並來找出更具限制性的索引並且使用該索引取行。
開發人員做 SQL 數據表設計的時候,一定要通盤考慮清楚。
renxiao2003 發表於 2011-08-21 20:55
謝謝分享,我還沒有碰到過啊。