<dependency> <groupId>com.alibaba.external</groupId> <artifactId>jakarta.commons.dbcp</artifactId> <version>1.4</version> </dependency>
2. dbcp的基本配置
相關配置說明:
- initialSize :連接池啟動時創建的初始化連接數量(默認值為0)
- maxActive :連接池中可同時連接的最大的連接數(默認值為8,調整為20,高峰單機器在20並發左右,自己根據應用場景定)
- maxIdle:連接池中最大的空閑的連接數,超過的空閑連接將被釋放,如果設置為負數表示不限制(默認為8個,maxIdle不能設置太小,因 為假如在高負載的情況下,連接的打開時間比關閉的時間快,會引起連接池中idle的個數 上升超過maxIdle,而造成頻繁的連接銷毀和創建,類似於jvm參數中的Xmx設置)
- minIdle:連接池中最小的空閑的連接數,低於這個數量會被創建新的連接(默認為0,調整為5,該參數越接近maxIdle,性能越好,因為 連接的創建和銷毀,都是需要消耗資源的;但是不能太大,因為在機器很空閑的時候,也會創建低於minidle個數的連接,類似於jvm參數中的Xmn設 置)
- maxWait :最大等待時間,當沒有可用連接時,連接池等待連接釋放的最大時間,超過該時間限制會拋出異常,如果設置-1表示無限等待(默認為無限,調整為60000ms,避免因線程池不夠用,而導致請求被無限制掛起)
- poolPreparedStatements:開啟池的prepared(默認是false,未調整,經過測試,開啟后的性能沒有關閉的好。)
- maxOpenPreparedStatements:開啟池的prepared 后的同時最大連接數(默認無限制,同上,未配置)
- minEvictableIdleTimeMillis :連接池中連接,在時間段內一直空閑, 被逐出連接池的時間
- (默認為30分鍾,可以適當做調整,需要和后端服務端的策略配置相關)
- removeAbandonedTimeout :超過時間限制,回收沒有用(廢棄)的連接(默認為 300秒,調整為180)
- removeAbandoned :超過removeAbandonedTimeout時間后,是否進 行沒用連接(廢棄)的回收(默認為false,調整為true)
- 如果開啟了removeAbandoned,當getNumIdle() < 2) and (getNumActive() > getMaxActive() - 3)時被觸發.
- 舉例當maxActive=20, 活動連接為18,空閑連接為1時可以觸發"removeAbandoned".但是活動連接只有在沒有被使用的時間超 過"removeAbandonedTimeout"時才被回收
- logAbandoned: 標記當連接被回收時是否打印程序的stack traces日志(默認為false,未調整)
- 代碼未在finally釋放connection , 不過我們都用sqlmapClientTemplate,底層都有鏈接釋放的過程
- 遇到數據庫死鎖。以前遇到過后端存儲過程做了鎖表操作,導致前台集群中連接池全都被block住,后續的業務處理因為拿不到鏈接所有都處理失敗了。
<bean id="dataSource" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close"> <property name="driverClassName" value="com.mysql.jdbc.Driver" /> <property name="url" value="xxxx" /> <property name="username"><value>xxxx</value></property> <property name="password"><value>xxxxx</value></property> <property name="maxActive"><value>20</value></property> <property name="initialSize"><value>1</value></property> <property name="maxWait"><value>60000</value></property> <property name="maxIdle"><value>20</value></property> <property name="minIdle"><value>3</value></property> <property name="removeAbandoned"><value>true</value></property> <property name="removeAbandonedTimeout"><value>180</value></property> <property name="connectionProperties"><value>clientEncoding=GBK</value></property> </bean>
- dbcp是采用了commons-pool做為其連接池管理,testOnBorrow,testOnReturn, testWhileIdle是pool是提供的幾種校驗機制,通過外部鈎子的方式回調dbcp的相關數據庫鏈接(validationQuery)校驗
- dbcp相關外部鈎子類:PoolableConnectionFactory,繼承於common-pool PoolableObjectFactory
- dbcp通過GenericObjectPool這一入口,進行連接池的borrow,return處理
- testOnBorrow : 顧明思義,就是在進行borrowObject進行處理時,對拿到的connection進行validateObject校驗
- testOnReturn : 顧明思義,就是在進行returnObject對返回的connection進行validateObject校驗,個人覺得對數據庫連接池的管理意義不大
- testWhileIdle : 關注的重點,GenericObjectPool中針對pool管理,起了一個Evict的TimerTask定時線程進行控制(可通過設置參數 timeBetweenEvictionRunsMillis>0),定時對線程池中的鏈接進行validateObject校驗,對無效的鏈接進 行關閉后,會調用ensureMinIdle,適當建立鏈接保證最小的minIdle連接數。
- timeBetweenEvictionRunsMillis,設置的Evict線程的時間,單位ms,大於0才會開啟evict檢查線程
- validateQuery, 代表檢查的sql
- validateQueryTimeout, 代表在執行檢查時,通過statement設置,statement.setQueryTimeout(validationQueryTimeout)
- numTestsPerEvictionRun,代表每次檢查鏈接的數量,建議設置和maxActive一樣大,這樣每次可以有效檢查所有的鏈接.
<property name="testWhileIdle"><value>true</value></property> <!-- 打開檢查,用異步線程evict進行檢查 --> <property name="testOnBorrow"><value>false</value></property> <property name="testOnReturn"><value>false</value></property> <property name="validationQuery"><value>select sysdate from dual</value></property> <property name="validationQueryTimeout"><value>1</value></property> <property name="timeBetweenEvictionRunsMillis"><value>30000</value></property> <property name="numTestsPerEvictionRun"><value>20</value></property>
相關配置需求:
- 目 前網站的應用大部分的瓶頸還是在I/O這一塊,大部分的I/O還是在數據庫的這一層面上,每一個請求可能會調用10來次SQL查詢,如果不走事務,一個請 求會重復獲取鏈接,如果每次獲取鏈接都進行validateObject,性能開銷不是很能接受,可以假定一次SQL操作消毫0.5~1ms(一般走了網 絡請求基本就這數)
- 網 站異常數據庫重啟,網絡異常斷開的頻率是非常低的,一般也就在數據庫升級,演習維護時才會進行,而且一般也是選在晚上,訪問量相對比較低的請求,而且一般 會有人員值班關注,所以異步的validateObject是可以接受,但一個前提需要確保能保證在一個合理的時間段內,數據庫能完成自動重聯。
public interface PoolableObjectFactory {
Object makeObject() throws Exception;
void destroyObject(Object obj) throws Exception;
boolean validateObject(Object obj);
void activateObject(Object obj) throws Exception;
void passivateObject(Object obj) throws Exception;
}
2. dbcp實現的pool從池管理操作
這里貼了一個相關validate代碼,具體類可見:PoolableConnectionFactory.validateConnection()
public class PoolableConnectionFactory implements PoolableObjectFactory { ...... public boolean validateObject(Object obj) { //驗證validateObject if(obj instanceof Connection) { try { validateConnection((Connection) obj); return true; } catch(Exception e) { return false; } } else { return false; } } public void validateConnection(Connection conn) throws SQLException { String query = _validationQuery; if(conn.isClosed()) { throw new SQLException("validateConnection: connection closed"); } if(null != query) { Statement stmt = null; ResultSet rset = null; try { stmt = conn.createStatement(); if (_validationQueryTimeout > 0) { stmt.setQueryTimeout(_validationQueryTimeout); } rset = stmt.executeQuery(query); if(!rset.next()) { throw new SQLException("validationQuery didn't return a row"); } } finally { if (rset != null) { try { rset.close(); } catch(Exception t) { // ignored } } if (stmt != null) { try { stmt.close(); } catch(Exception t) { // ignored } } } } } .... }
3. pool池的evict調用代碼:GenericObjectPool (apache commons pool version 1.5.4)
protected synchronized void startEvictor(long delay) { //啟動Evictor為TimerTask if(null != _evictor) { EvictionTimer.cancel(_evictor); _evictor = null; } if(delay > 0) { _evictor = new Evictor(); EvictionTimer.schedule(_evictor, delay, delay); } } for (int i=0,m=getNumTests();i<m;i++) { final ObjectTimestampPair pair; ....... boolean removeObject = false; // 空閑鏈接處理 final long idleTimeMilis = System.currentTimeMillis() - pair.tstamp; if ((getMinEvictableIdleTimeMillis() > 0) && (idleTimeMilis > getMinEvictableIdleTimeMillis())) { removeObject = true; } else if ((getSoftMinEvictableIdleTimeMillis() > 0) && (idleTimeMilis > getSoftMinEvictableIdleTimeMillis()) && ((getNumIdle() + 1)> getMinIdle())) { removeObject = true; } // testWhileIdle sql 檢查處理 if(getTestWhileIdle() && !removeObject) { boolean active = false; try { _factory.activateObject(pair.value); active = true; } catch(Exception e) { removeObject=true; } if(active) { if(!_factory.validateObject(pair.value)) { removeObject=true; } else { try { _factory.passivateObject(pair.value); } catch(Exception e) { removeObject=true; } } } } // 真正關閉 if (removeObject) { try { _factory.destroyObject(pair.value); } catch(Exception e) { // ignored } } ........
注意: 目前dbcp的pool的實現是使用了公用的apache common pools進行擴展處理,所以和原生的連接池處理,代碼看上去有點別扭,感覺自動重連這塊異常處理不怎么好,我也就只重點關注了這部分代碼而已 .
3. dbcp的鏈接自動重鏈相關測試
相關場景:
- 數據庫意外重啟后,原先的數據庫連接池能自動廢棄老的無用的鏈接,建立新的數據庫鏈接
- 網絡異常中斷后,原先的建立的tcp鏈接,應該能進行自動切換
測試需求1步驟
- 建立一testCase代碼
- 配置mysql數據庫
- 循環執行在SQL查詢過程
- 異常重啟mysql數據庫
測試需求2步驟
- 建立一testCase代碼
- 配置mysql數據庫
- 循環執行在SQL查詢過程
- 通過iptables禁用網絡鏈接
/sbin/iptables -A INPUT -s 10.16.2.69 -j REJECT
/sbin/iptables -A FORWARD -p tcp -s 10.16.2.69 --dport 3306 -m state --state NEW,ESTABLISHED -j DROP
5. iptables -F 清空規則,恢復鏈接通道。
測試需求問題記錄
分別測試了兩種配置,有validateObject的配置和沒有validateObject的相關配置。
1. 沒有validate配置
問題一: 異常重啟mysql數據庫后,居然也可以自動恢復鏈接,sql查詢正常
跟蹤了一下代碼,發現這么一個問題:
- 在數據庫關閉的時候,client中pool通過borrowObject獲取一個異常鏈接返回給client
- client在使用具體的異常鏈接進行sql調用出錯了,拋了異常
- 在finally,調用connection.close(),本意是應該調用pool通過returnObject返回到的池中,但在跟蹤代碼時,未見調用GenericObjectPool的returnObject
- 繼續查,發現在dbcp在中PoolingDataSource(實現DataSource接口)調用 PoolableConnection(dbcp pool相關的delegate操作)進行相應關閉時,會檢查_conn.isClosed(),針對DataSource如果isClosed返回為 true的則不調用returnObject,直接丟棄了鏈接
解釋:
- 正因為在獲取異常鏈接后,因為做了_conn.isClosed()判斷,所以異常鏈接並沒有返回到連接池中,所以到數據庫重啟恢復后,每次都是調用pool重新構造一個新的connection,所以后面就正常了
- _conn.isClosed()是否保險,從jdk的api描述中: A connection is closed if the method close has been called on it or if certain fatal errors have occurred. 里面提供兩種情況,一種就是被調用了closed方法,另一種就是出現一些異常也說的比較含糊。
問題二:validateObject調用時,dbcp設置的validationQueryTimeout居然沒效果
看了mysql statement代碼實現,找到了答案。
mysql com.mysql.jdbc.statemen 部分代碼
timeout時間處理:
timeoutTask = new CancelTask(); //通過TimerTask啟動一定時任務 Connection.getCancelTimer().schedule(timeoutTask, this.timeoutInMillis);
對應的CancelTask的代碼:
class CancelTask extends TimerTask { long connectionId = 0; CancelTask() throws SQLException { connectionId = connection.getIO().getThreadId(); } public void run() { Thread cancelThread = new Thread() { public void run() { Connection cancelConn = null; java.sql.Statement cancelStmt = null; try { cancelConn = connection.duplicate(); cancelStmt = cancelConn.createStatement(); // 簡單暴力,再發起一條KILL SQL,關閉先前的sql thread id cancelStmt.execute("KILL QUERY " + connectionId); wasCancelled = true; } catch (SQLException sqlEx) { throw new RuntimeException(sqlEx.toString()); } finally { if (cancelStmt != null) { try { cancelStmt.close(); } catch (SQLException sqlEx) { throw new RuntimeException(sqlEx.toString()); } } if (cancelConn != null) { try { cancelConn.close(); } catch (SQLException sqlEx) { throw new RuntimeException(sqlEx.toString()); } } } } }; cancelThread.start(); } }
原因總結一句話: queryTimeout的實現是通過底層數據庫提供的機制,比如KILL QUERY pid. 如果此時的網絡不通,出現阻塞現象,對應的kill命令也發不出去,所以timeout設置的超時沒效果。
4.最后
最后還是決定配置testWhileIdle掃描,主要考慮:
- pool池中的鏈接如果未被使用,可以通過testWhileIdle進行鏈接檢查,避免在使用時后總要失敗那么一次,可以及時預防
- 配合連接池的minEvictableIdleTimeMillis(空閑鏈接),removeAbandoned(未釋放的鏈接),可以更好的 去避免因為一些異常情況引起的問題,防范於未然。比如使用一些分布式數據庫的中間件,會有空閑鏈接關閉的動作,動態伸縮連接池,這時候需要能及時的發現, 避免請求失敗。
- testOnBorrow個人不太建議使用,存在性能問題,試想一下連接一般會在什么情況出問題,網絡或者服務端異常終端空閑鏈接,網絡中斷你 testOnBorrow檢查發現不對再取一個鏈接還是不對,針對空閑鏈接處理異常關閉,可以從好業務端的重試策略進行考慮,同時配置客戶端的空閑鏈接超 時時間,maxIdle,minIdle等。
--------------------------------------------
新加的內容:
5.dbcp密碼加密處理
以前使用jboss的jndi數據源的方式,是通過配置oracle-ds.xml,可以設置<security- domain>EncryptDBPassword</security-domain>,引用jboss login-config.xml配置的加密配置。
<application-policy name="EncryptDBPassword"> <authentication> <login-module code="org.jboss.resource.security.SecureIdentityLoginModule" flag="required"> <module-option name="username">${username}</module-option> <module-option name="password">${password_encrypt}</module-option> <module-option name="managedConnectionFactoryName">jboss.jca:service=LocalTxCM,name=${jndiName}</module-option> </login-module> </authentication> </application-policy>
為了能達到同樣的效果,切換為spring dbcp配置時,也有類似密碼加密的功能,運行期進行密碼decode,最后進行數據鏈接。
實現方式很簡單,分析jboss的對應SecureIdentityLoginModule的實現,無非就是走了Blowfish加密算法,自己拷貝實現一份。
private static String encode(String secret) throws NoSuchPaddingException, NoSuchAlgorithmException, InvalidKeyException, BadPaddingException, IllegalBlockSizeException { byte[] kbytes = "jaas is the way".getBytes(); SecretKeySpec key = new SecretKeySpec(kbytes, "Blowfish"); Cipher cipher = Cipher.getInstance("Blowfish"); cipher.init(Cipher.ENCRYPT_MODE, key); byte[] encoding = cipher.doFinal(secret.getBytes()); BigInteger n = new BigInteger(encoding); return n.toString(16); } private static char[] decode(String secret) throws NoSuchPaddingException, NoSuchAlgorithmException, InvalidKeyException, BadPaddingException, IllegalBlockSizeException { byte[] kbytes = "jaas is the way".getBytes(); SecretKeySpec key = new SecretKeySpec(kbytes, "Blowfish"); BigInteger n = new BigInteger(secret, 16); byte[] encoding = n.toByteArray(); Cipher cipher = Cipher.getInstance("Blowfish"); cipher.init(Cipher.DECRYPT_MODE, key); byte[] decode = cipher.doFinal(encoding); return new String(decode).toCharArray(); }
最后的配置替換為:
<bean id="dataSource" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close"> ...... <property name="password"><!-- 注意多了一層轉化,將密碼串調用decode解密為最初的數據庫密碼 --> <bean class="com.xxxxx.EncryptDBPasswordFactory"> <property name="password" value="${xxxx.password.encrypted}" /> </bean> </property> ........ </bean>
--------------------------------------------
新加的內容:
6.數據庫重連機制
常見的問題:
1. 數據庫意外重啟后,原先的數據庫連接池能自動廢棄老的無用的鏈接,建立新的數據庫鏈接
2. 網絡異常中斷后,原先的建立的tcp鏈接,應該能進行自動切換。比如網站演習中的交換機重啟會導致網絡瞬斷
3. 分布式數據庫中間件,比如amoeba會定時的將空閑鏈接異常關閉,客戶端會出現半開的空閑鏈接。
大致的解決思路:
1. sql心跳檢查
主動式 ,即我前面提到的sql validate相關配置
2. 請求探雷
犧牲小我,完成大我的精神。 拿鏈接嘗試一下,發現處理失敗丟棄鏈接,探雷的請求總會失敗幾個,就是前面遇到的問題一,dbcp已經支持該功能,不需要額外置。
3. 設置合理的超時時間,
解決半開鏈接. 一般數據庫mysql,oracle都有一定的鏈接空閑斷開的機制,而且當你使用一些分布式中間件(軟件一類的),空閑鏈接控制會更加嚴格,這時候設置合理的超時時間可以有效避免半開鏈接。
一般超時時間,dbcp主要是minEvictableIdleTimeMillis(空閑鏈接) , removeAbandonedTimeout(鏈接泄漏)。可以見前面的參數解釋
一個DBCP的比較完整的連接池配置(Mysql)(spring項目)
MYSQLURL與驅動不貼出來了,配置文件里都有。
mysql.user=root
mysql.password=root
mysql.connectionPool.maxActive=20
mysql.connectionPool.initialSize=4
mysql.connectionPool.minIdle=5
mysql.connectionPool.maxIdle=20
mysql.connectionPool.maxWait=60000
mysql.connectionPool.removeAbandoned=true
在項目中,我使用spring去配置DBCP,讀取上述資源文件信息
xml代碼
<bean id="dsMysql" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close"> <property name="driverClassName"> <value>${driver.mysql}</value> </property> <property name="url"> <value>${mysql.url}</value> </property> <property name="username"> <value>${mysql.user}</value> </property> <property name="password"> <value>${mysql.password}</value> </property> <!-- 連接池啟動時創建的初始化連接數量(不設定即為0)--> <property name="initialSize"> <value>${mysql.connectionPool.initialSize}</value> </property> <!-- 連接池中可同時連接的最大的連接數(默認值為8) --> <property name="maxActive"> <value>${mysql.connectionPool.maxActive}</value> </property> <!-- 連接池中最小的空閑的連接數,低於這個數量會被創建新的連接 --> <property name="minIdle"> <value>${mysql.connectionPool.minIdle}</value> </property> <!-- 連接池中最大的空閑的連接數,超過的空閑連接將被釋放 --> <property name="maxIdle"> <value>${mysql.connectionPool.maxIdle}</value> </property> <!-- 最大等待時間,當沒有可用連接時,連接池等待連接釋放的最大時間,超過該時間限制會拋出異常 --> <property name="maxWait"> <value>${mysql.connectionPool.maxWait}</value> </property> <!-- removeAbandoned屬性說明 --> <!-- 超過removeAbandonedTimeout時間后,是否進 行沒用連接(廢棄)的回收(默認為false) --> <!-- 舉例當maxActive=20, 活動連接為18,空閑連接為1時可以觸發"removeAbandoned".但是活動連接只有在沒有被使用的時間超 過"removeAbandonedTimeout(這里默認為300秒)"時才被回收 --> <!-- 遇到數據庫死鎖。以前遇到過后端存儲過程做了鎖表操作,導致前台集群中連接池全都被block住,后續的業務處理因為拿不到鏈接所有都處理失敗了。 --> <property name="removeAbandoned"> <value>${mysql.connectionPool.removeAbandoned}</value> </property> </bean>
參考:https://www.cnblogs.com/duanxz/p/3668614.html