1.什么是分库分表
在同一个系统(项目)中,把一张数据比较多的表放到不同的集群节点上,这种模式就称之为分库分表
2.需求
使用mycat实现分库分表(HDFS:namenode datanode secondarynamdenode)
在整个mycat中也会使用到namenode和datanode
mysql01服务器(linux)192.168.152.147:
mysql数据库
TEACH(真实的库)
book(表)
mysql02服务器(linux)192.168.152.148:
mysql数据库
TEACH(真实的库)
book(表)
使用mycat(192.168.152.149)把数据分别存放在两个student中,也就是说这两张student表合在一起才是一个完整的数据表
mycat --> mysql01存入一条数据
mycat --> mysql02存入一条数据
依次交替
3.配置mycat
3.1.规定linux的用户名和全名不能叫mycat!!!否则mycat会不生效(原因是影响整个linux系统的环境变量导致mycat的配置环境变量没有生效)
3.2.vim /etc/sysconfig/network也不能叫mycat
3.3.mycat使用的是Java语言编写-->所以必须要在linux上配置jdk(要求jdk必须为64位,因为mycat是在64位的jdk8上进行编译的)
3.4.配置jdk
3.5.使用xftp把mycat的压缩包上传到linux服务器上
3.6.解压mycat压缩包
tar -zxvf xxxxx
3.7.配置mycat的环境变量
3.8.启动mycat
进入mycat的bin目录
./mycat console
或者在任意的位置直接使用(需配置环境变量)
mycat console start | stop | restart | status | dump
mycat console 类似于IDEA中控制台,mycat会把日志打印出来
mycat start 就是正常启动
一般情况下推荐使用console启动
一旦启动mycat就关不掉,kill -9关不掉 除非重启或者关机
看到以下信息说明启动成功:
jvm 1 | MyCAT Server startup successfully. see logs in logs/mycat.log
4.mycat的三个核心配置文件
所有的读写分离/分库分表都必须要在这三个配置文件完成
mycat的conf目录
server.xml:
配置了mycat的用户(账号:root 密码:root) --> 账号和密码可以根据情况随意更改
相当于mysql的用户(账号:root 密码:root)
mycat也是可以直接使用数据库连接软件进行连接的
<!-- 整个user标签中就是配置了mycat的账号和密码 name===》就是mycat的账号 defaultAccount====》表示该账号为管理员账号,而且只能出现一次 property:属性标签 password===》就是name的密码 无论是账号还是密码都可以随意定制,开心就好!!! readOnly:只读(该账号只能查询数据,不能写入数据) schemas:指向的是mycat的数据库(mycat的虚拟库!!!这个库并不是真实存在的,是需要通过mysql的数据库进行映射的),一个mycat中可以有多个schema 隐藏mysql的真实库的名字 连接mysql: jdbc:mysql:localhost:3306/数据库名 连接mycat: jdbc:mysql:ip地址:端口号/mycat的虚拟库名 schemas中的配置和mysql的数据库可以一样,也可以不一样 --> <user name="root" defaultAccount="true"> <property name="password">123456</property> <property name="schemas">TEACH</property> </user>
rule.xml:
mycat的规则
<!-- 所有的规则配置一个tableRule对应一个function,如果需要进行配置必须要配置一对,不能单独配置一个(如果单独配置了一个的情况下,mycat启动的时候会直接报错) 一共有十种规则: homework1: 百度把这10种规则全部弄明白,然后整理一份用自己语言描述的电子文档 mod-long:(轮询) mysql01 mysql数据库 teach student mysql02 mysql数据库 teach student 当客户端发送请求===插入数据===》mycat===请求mysql===》会把第一条数据插入进mysql01, 会把第二条数据插入进mysql02 依次循环 --> <tableRule name="mod-long"> <rule> <columns>id</columns> <algorithm>mod-long</algorithm> </rule> </tableRule> <function name="mod-long" class="io.mycat.route.function.PartitionByMod"> <!-- 代表了datanode的节点数量 如果只有两台datanode就必须要写2 --> <property name="count">2</property> </function>
schema.xml:
实现了读写分离和分库分表的具体配置
<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/">
<!--
!!!schema标签的name属性值必须要和server.xml中的schames保持一致!!!
schema就类似于mysql的数据库
checkSQLschema:检查SQL语句是否错误(select * from user wher id = 1)
默认值为false,不需要改为true,把对SQL语句的检查交给mysql处理
sqlMaxLimit:最大执行SQL语句的数量
一次性可以执行多少条SQL语句
在schame标签中有table标签,这个标签就是定义了mycat中的表
类似于mysql数据库中的表
和mysql中的表名可以重复也可以不一致
dataNode:数据节点
在HDFS中存放数据
在mycat中映射的就是真实mysql数据库(可以有多个,也可以只有一个),名字可以随意起
今天的目标是实现分库分表,需要用到两台mysql数据库,所以只需要配置dn1和dn2
rule:配置规则
配置一定要和rule.xml中保持一致
-->
<schema name="TEACH" checkSQLschema="false" sqlMaxLimit="100">
<!-- auto sharding by id (long) -->
<table name="book" dataNode="dn1,dn2" rule="mod-long" />
</schema>
<!--
datanode标签对应的是table标签中的datanode属性
也就是说datanode属性值必须要和dataNode的标签name属性值保值一致
dn1:代表了mysql01服务器==》mysql数据库
dn2:代表了mysql02服务器==》mysql数据库
dataHost:才是真正的配置了分库分表和读写分离的核心配置
database:映射的是真实mysql的数据库名
-->
<dataNode name="dn1" dataHost="localhost1" database="TEACH" />
<dataNode name="dn2" dataHost="localhost2" database="TEACH" />
<!--
dataHost标签必须要和dataNode标签中的dataHost属性保持一致
如果dataHost属性名重复了,映射的是同一个dataHost
每一个dataHost标签就是一个真实的mysql数据库
maxCon:最大连接数
minCon:最小连接数
balance: homework2:
把balance,writeType,switchType弄明白,并且用自己的语言描述每个值代表什么意思,记录电子文档负载均衡
writeType:写入的类型(读写分离使用)
switchType:转换的类型(读写分离所使用的数据)
dbType:数据库的类型(在最早的版本mycat只支持mysql一种数据库,后来发展支持很多种数据库)
dbDriver:数据库驱动(使用本地驱动,使用的是mycat所提供的驱动)
slaveThreshold:自己查!!!!
master:主节点
slave:从节点
threshold:入口
-->
<dataHost name="localhost1" maxCon="1000" minCon="10" balance="0"
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<!--
heartbeat:心跳
mycat一直在监视mysql的user表(心跳),如果一旦发现mysql的user不再有心跳,就会认为这一台mysql处于宕机状态,也就不会再向这一台mysql进行做增删改查的操作
-->
<heartbeat>select user()</heartbeat>
<!--
writeHost:标签是该台mysql数据库为读和写的数据库
readHost:标签是该台mysql数据库为读的数据库
writeHost如果单独存在,标识该台mysql数据库为读和写的操作
如果一旦和readHost一起使用,writeHost就只能做些的操作,所有的读操作都使用readHost完成
readHost必须要配置在writeHost的内容,不允许单独存在
host:属性只是标识了该台数据库的操作的内容,可以随意定义
url:数据库的url
jdbc:mysql://localhost:3306
!!!!!如果配置了两个writeHost,那么host的值就必须不能重复!!!!!
-->
<writeHost host="write01" url="192.168.23.129:3306" user="root"
password="root" />
</dataHost>
<dataHost name="localhost2" maxCon="1000" minCon="10" balance="0"
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<heartbeat>select user()</heartbeat>
<writeHost host="write02" url="192.168.23.130:3306" user="root"
password="root" />
</dataHost>
<!--
mycat中所映射的真实mysql的表必须要mycat所声明的table的名字保持一致
也就是说mycat的表名必须要和mysql的表名一模一样,否则映射不到
-->
</mycat:schema>
其实mycat也可以看成是一个数据库,只是这个数据库是虚拟的,把真实的mysql数据中的表数据映射进了虚拟库中,使用Java项目连接的时候只需要连接mycat即可,不再需要连接mysql
启动成功后可以直接使用数据库连接工具连接mycat
mycat的dbType配置的是什么数据库,就使用这一种数据库进行连接即可
mycat有两个端口号:
9066:管理端口号(管理mycat使用的)
8066:通讯端口号(连接端口号)
