1、什么是分庫分表
2、分庫分表的大致分配
3、Linux下配置mycat服務器
1、什么是分庫分表?
在同一個系統(項目)中,把一張數據比較多的表拆分到不同的集群節點上,
這種模式叫做分庫分表
2、分庫分表的實現:
使用mycat實現分庫分表(HDFS:namenode datanode secondarynamdenode)
在整個mycat中也會用到namenode和datanode
(1)先配置一台mycat服務器(192.168.23.164)
(2)然后配置兩台mysql服務器:mysql01(192.168.23.129)和mysql02(192.168.23.130)
在mysql01服務器下有一個teach數據庫,在teach下有一個student表
在mysql02服務器下有一個teach數據庫,在teach下有一個student表
當使用mycat把進行存儲是,數據會自動往mysql01或mysql02中存儲.
3、配置mycat
3.1 規定Linux的用戶名和全名不能叫mycat,否則mycat不會生效(原因是影響了Linux系統的環境變量)
3.2 vim /etc/sysconfig/network也不能叫mycat
3.3 mycat使用的是Java語言編寫-->所以必須要在Linux上配置jdk
(要求jdk是64位,因為mycat是在64位的jdk8 上進行編譯的)
3.4 配置jdk
3.5 使用xftp把mycat的壓縮包上傳到Linux服務器上(/home/apps/)
3.6 解壓mycat壓縮包
tar -zxvf xxxx
3.7 配置mycat的環境變量(與jdk的環境變量配置一樣)
3.8 啟動mycat(兩種方式)
(1)進入mycat的bin目錄: ./mycat console(推薦使用)
或者在其他的地方的目錄:mycat console
(2)./mycat start
一旦啟動mycat就關不掉,kill -9 進程號 也關不掉,除非重啟或者關機,
據說可以使用Ctrl+C
3.9 下面就是三個核心配置文件了(最重要的地方):
所有的讀寫分離/分庫分表都必須要在這三個配置文件完成
在mycat的conf目錄下:
server.xml:配置了mycat的用戶
rule.xml:mycat的規則
schema.xml:實現了讀寫分離和分庫分表的具體配置
server:
<?xml version="1.0" encoding="UTF-8"?>
<!-- - - Licensed under the Apache License, Version 2.0 (the "License");
- you may not use this file except in compliance with the License. - You
may obtain a copy of the License at - - http://www.apache.org/licenses/LICENSE-2.0
- - Unless required by applicable law or agreed to in writing, software -
distributed under the License is distributed on an "AS IS" BASIS, - WITHOUT
WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. - See the
License for the specific language governing permissions and - limitations
under the License. -->
<!DOCTYPE mycat:server SYSTEM "server.dtd">
<mycat:server xmlns:mycat="http://io.mycat/">
<system>
<property name="nonePasswordLogin">0</property> <!-- 0為需要密碼登陸、1為不需要密碼登陸 ,默認為0,設置為1則需要指定默認賬戶-->
<property name="useHandshakeV10">1</property>
<property name="useSqlStat">0</property> <!-- 1為開啟實時統計、0為關閉 -->
<property name="useGlobleTableCheck">0</property> <!-- 1為開啟全加班一致性檢測、0為關閉 -->
<property name="sequnceHandlerType">2</property>
<!--<property name="sequnceHandlerPattern">(?:(\s*next\s+value\s+for\s*MYCATSEQ_(\w+))(,|\)|\s)*)+</property>-->
<!--必須帶有MYCATSEQ_或者 mycatseq_進入序列匹配流程 注意MYCATSEQ_有空格的情況-->
<property name="sequnceHandlerPattern">(?:(\s*next\s+value\s+for\s*MYCATSEQ_(\w+))(,|\)|\s)*)+</property>
<property name="subqueryRelationshipCheck">false</property> <!-- 子查詢中存在關聯查詢的情況下,檢查關聯字段中是否有分片字段 .默認 false -->
<!-- <property name="useCompression">1</property>--> <!--1為開啟mysql壓縮協議-->
<!-- <property name="fakeMySQLVersion">5.6.20</property>--> <!--設置模擬的MySQL版本號-->
<!-- <property name="processorBufferChunk">40960</property> -->
<!--
<property name="processors">1</property>
<property name="processorExecutor">32</property>
-->
<!--默認為type 0: DirectByteBufferPool | type 1 ByteBufferArena | type 2 NettyBufferPool -->
<property name="processorBufferPoolType">0</property>
<!--默認是65535 64K 用於sql解析時最大文本長度 -->
<!--<property name="maxStringLiteralLength">65535</property>-->
<!--<property name="sequnceHandlerType">0</property>-->
<!--<property name="backSocketNoDelay">1</property>-->
<!--<property name="frontSocketNoDelay">1</property>-->
<!--<property name="processorExecutor">16</property>-->
<!--
<property name="serverPort">8066</property> <property name="managerPort">9066</property>
<property name="idleTimeout">300000</property> <property name="bindIp">0.0.0.0</property>
<property name="frontWriteQueueSize">4096</property> <property name="processors">32</property> -->
<!--分布式事務開關,0為不過濾分布式事務,1為過濾分布式事務(如果分布式事務內只涉及全局表,則不過濾),2為不過濾分布式事務,但是記錄分布式事務日志-->
<property name="handleDistributedTransactions">0</property>
<!--
off heap for merge/order/group/limit 1開啟 0關閉
-->
<property name="useOffHeapForMerge">0</property>
<!--
單位為m
-->
<property name="memoryPageSize">64k</property>
<!--
單位為k
-->
<property name="spillsFileBufferSize">1k</property>
<property name="useStreamOutput">0</property>
<!--
單位為m
-->
<property name="systemReserveMemorySize">384m</property>
<!--是否采用zookeeper協調切換 -->
<property name="useZKSwitch">false</property>
<!-- XA Recovery Log日志路徑 -->
<!--<property name="XARecoveryLogBaseDir">./</property>-->
<!-- XA Recovery Log日志名稱 -->
<!--<property name="XARecoveryLogBaseName">tmlog</property>-->
<!--如果為 true的話 嚴格遵守隔離級別,不會在僅僅只有select語句的時候在事務中切換連接-->
<property name="strictTxIsolation">false</property>
<property name="useZKSwitch">true</property>
</system>
<!--
從system標簽開始到結束中的內容配置了
連接 最大連接數 最小連接數 連接超時時間 隔離機制 事務切換....
相當於在mybatis中配置數據庫的最大最小連接數 連接超時時間
-->
<!-- 全局SQL防火牆設置 -->
<!--白名單可以使用通配符%或着*-->
<!--例如<host host="127.0.0.*" user="root"/>-->
<!--例如<host host="127.0.*" user="root"/>-->
<!--例如<host host="127.*" user="root"/>-->
<!--例如<host host="1*7.*" user="root"/>-->
<!--這些配置情況下對於127.0.0.1都能以root賬戶登錄-->
<!--
<firewall>
<whitehost>
<host host="1*7.0.0.*" user="root"/>
</whitehost>
<blacklist check="false">
</blacklist>
</firewall>
-->
<!--
整個user標簽中就是配置了mycat的賬號和密碼
name===》就是mycat的賬號
defaultAccount====》表示該賬號為管理員賬號,而且只能出現一次
property:屬性標簽
password===》就是name的密碼
無論是賬號還是密碼都可以隨意定制,開心就好!!!
readOnly:只讀(該賬號只能查詢數據,不能寫入數據)
schemas:指向的是mycat的數據庫(mycat的虛擬庫!!!這個庫並不是真實存在的,是需要通過mysql的數據庫進行映射的),一個mycat中可以有多個schema
隱藏mysql的真實庫的名字
連接mysql:
jdbc:mysql:localhost:3306/數據庫名
連接mycat:
jdbc:mysql:ip地址:端口號/mycat的虛擬庫名
schemas中的配置和mysql的數據庫可以一樣,也可以不一樣
-->
<user name="root" defaultAccount="true">
<property name="password">123456</property>
<property name="schemas">TEACH</property>
</user>
</mycat:server>
rule.xml:
<?xml version="1.0" encoding="UTF-8"?>
<!-- - - Licensed under the Apache License, Version 2.0 (the "License");
- you may not use this file except in compliance with the License. - You
may obtain a copy of the License at - - http://www.apache.org/licenses/LICENSE-2.0
- - Unless required by applicable law or agreed to in writing, software -
distributed under the License is distributed on an "AS IS" BASIS, - WITHOUT
WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. - See the
License for the specific language governing permissions and - limitations
under the License. -->
<!DOCTYPE mycat:rule SYSTEM "rule.dtd">
<mycat:rule xmlns:mycat="http://io.mycat/">
<!--
所有的規則配置一個tableRule對應一個function,如果需要進行配置必須要配置一對,不能單獨配置一個(如果單獨配置了一個的情況下,mycat啟動的時候會直接報錯)
一共有十種規則:
homework1:
百度把這10種規則全部弄明白,然后整理一份用自己語言描述的電子文檔
mod-long:(輪詢)
mysql01
mysql數據庫
teach
student
mysql02
mysql數據庫
teach
student
當客戶端發送請求===插入數據===》mycat===請求mysql===》會把第一條數據插入進mysql01,
會把第二條數據插入進mysql02
依次循環
-->
<tableRule name="mod-long">
<rule>
<columns>id</columns>
<algorithm>mod-long</algorithm>
</rule>
</tableRule>
<function name="mod-long" class="io.mycat.route.function.PartitionByMod">
<!--
代表了datanode的節點數量
如果只有兩台datanode就必須要寫2
-->
<property name="count">2</property>
</function>
</mycat:rule>
schema.xml
<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/">
<!--
!!!schema標簽的name屬性值必須要和server.xml中的schames保持一致!!!
schema就類似於mysql的數據庫
checkSQLschema:檢查SQL語句是否錯誤(select * from user wher id = 1)
默認值為false,不需要改為true,把對SQL語句的檢查交給mysql處理
sqlMaxLimit:最大執行SQL語句的數量
一次性可以執行多少條SQL語句
在schame標簽中有table標簽,這個標簽就是定義了mycat中的表
類似於mysql數據庫中的表
和mysql中的表名可以重復也可以不一致
dataNode:數據節點
在HDFS中存放數據
在mycat中映射的就是真實mysql數據庫(可以有多個,也可以只有一個),名字可以隨意起
今天的目標是實現分庫分表,需要用到兩台mysql數據庫,所以只需要配置dn1和dn2
rule:配置規則
配置一定要和rule.xml中保持一致
-->
<schema name="TEACH" checkSQLschema="false" sqlMaxLimit="100">
<!-- auto sharding by id (long) -->
<table name="mycat_student" dataNode="dn1,dn2" rule="mod-long" />
</schema>
<!--
datanode標簽對應的是table標簽中的datanode屬性
也就是說datanode屬性值必須要和dataNode的標簽name屬性值保值一致
dn1:代表了mysql01服務器==》mysql數據庫
dn2:代表了mysql02服務器==》mysql數據庫
dataHost:才是真正的配置了分庫分表和讀寫分離的核心配置
database:映射的是真實mysql的數據庫名
-->
<dataNode name="dn1" dataHost="localhost1" database="mysql01" />
<dataNode name="dn2" dataHost="localhost2" database="mysql02" />
<!--
dataHost標簽必須要和dataNode標簽中的dataHost屬性保持一致
如果dataHost屬性名重復了,映射的是同一個dataHost
每一個dataHost標簽就是一個真實的mysql數據庫
maxCon:最大連接數
minCon:最小連接數
homework2:
把balance,writeType,switchType弄明白,並且用自己的語言描述每個值代表什么意思,記錄電子文檔
balance:負載均衡
writeType:寫入的類型(讀寫分離使用)
switchType:轉換的類型(讀寫分離所使用的數據)
dbType:數據庫的類型(在最早的版本mycat只支持mysql一種數據庫,后來發展支持很多種數據庫)
dbDriver:數據庫驅動(使用本地驅動,使用的是mycat所提供的驅動)
slaveThreshold:主從復制時延
master:主節點
slave:從節點
threshold:入口
-->
<dataHost name="localhost1" maxCon="1000" minCon="10" balance="0"
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<!--
heartbeat:心跳
mycat一直在監視mysql的user表(心跳),如果一旦發現mysql的user不再有心跳,就會認為這一台mysql處於宕機狀態,也就不會再向這一台mysql進行做增刪改查的操作
-->
<heartbeat>select user()</heartbeat>
<!--
writeHost:標簽是該台mysql數據庫為讀和寫的數據庫
readHost:標簽是該台mysql數據庫為讀的數據庫
writeHost如果單獨存在,標識該台mysql數據庫為讀和寫的操作
如果一旦和readHost一起使用,writeHost就只能做些的操作,所有的讀操作都使用readHost完成
readHost必須要配置在writeHost的內容,不允許單獨存在
host:屬性只是標識了該台數據庫的操作的內容,可以隨意定義
url:數據庫的url
jdbc:mysql://localhost:3306
!!!!!如果配置了兩個writeHost,那么host的值就必須不能重復!!!!!
-->
<writeHost host="write01" url="192.168.23.129:3306" user="root"
password="root" />
</dataHost>
<dataHost name="localhost2" maxCon="1000" minCon="10" balance="0"
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<heartbeat>select user()</heartbeat>
<writeHost host="write02" url="192.168.23.130:3306" user="root"
password="root" />
</dataHost>
<!--
mycat中所映射的真實mysql的表必須要mycat所聲明的table的名字保持一致
也就是說mycat的表名必須要和mysql的表名一模一樣,否則映射不到
-->
</mycat:schema>
配置完成:
進入到Navicat中,先新建連接,分別連接mysql01和mysql02,然后分別在mysql01和mysql02
中分別建立兩個數據庫(庫名可以不一致),再分別建立mycat_student表,
然后建立mycat01的連接,(在建立連接時,端口號為8066,即通訊端口號,不能使用9066,為管理端口號)
在mycat01中會有一個TEACH數據庫,在庫中有一個mycat_student表,
這是在配置文件中的配置生效了。
至此,配置結束。使用Java代碼進行實現:只需要修改數據源就行了(只用連接mycat01數據庫)
當進行存儲的時候,由於我們使用的是輪詢規則,數據會自動輪流存儲到mysql01和mysql02.