通过 PXD 部署集群
PXD 是 PolarDB-X 的部署工具,除了支持在本地一键快速拉起测试环境外,也支持在 Linux 集群中通过指定的拓扑的方式部署 PolarDB-X 分布式数据库。
系统配置
- 每台机器磁盘空间>=100G,建议磁盘类型为 SSD。
- 集群内的所有机器都能访问互联网。
如果您使用的是阿里云ECS,可以参考文档:连接公网概述 为云服务器开通访问互联网的能力。
- 关闭所有机器的防火墙。
- 在集群内的所有机器上安装 Docker,参考文档:https://docs.docker.com/engine/install/
注:集群模式下,docker engine 版本需要大于等于18.04。
安装完成后执行
docker ps
命令验证。如果遇到报错:"Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock: Get http:///var/run/docker.sock/v1.26/images/json: dial unix /var/run/docker.sock: connect: permission denied",请参考:非root用户如何获取docker权限如果您在阿里云ECS部署,建议执行
docker info
检查 docker registry mirror配置,将其切换成上交的镜像源:docker.mirrors.sjtug.sjtu.edu.cn - 集群机器建配置免密登录。选择任意一台机器作为部署机,配置部署机到集群所有机器的免密登录
如果您的机器有多张网卡,为了保证网络的质量,建议使用内网网卡的ip进行免密配置,不要使用公网ip。
如果您的机器有多张内网网卡,建议采用
hostname -i
命令输出的ip 进行部署。hostname -i
的输出可以通过修改/etc/hosts
文件配置。
# 生成密钥对
ssh-keygen -t rsa
# 复制免登公钥到目标机器,修改user和ip
# 部署机也需要能免密登录自己
ssh-copy-id {user}@{ip}
# 例如集群中有如下三台机器:
#192.168.1.100 # PXD 部署机
#192.168.1.101
#192.168.1.102
# 则需要在192.168.1.100 上执行如下命令完成免密配置:
ssh-keygen -t rsa
ssh-copy-id {user}@192.168.1.100
ssh-copy-id {user}@192.168.1.101
ssh-copy-id {user}@192.168.1.102
在部署机上安装 PXD
选择任意一台机器作为部署机,在这台机器上安装 PXD 即可。PXD 会通过部署机在集群内创建 PolarDB-X 数据库。
准备工作
1.安装 Python3
如果你的机器上已经安装了 python3,可以跳过
检查命令:
which python3
,如果有返回则代表python3已安装
Red Hat, CentOS or Fedora:
yum update -y
yum install -y python3
Debian or Ubuntu:
apt-get update
apt-get install python3.7
2.创建一个 Python3 的 virtual environment 环境并激活
python3 -m venv venv
source venv/bin/activate
推荐使用 virtual environment 安装 PXD 工具
安装 PXD
安装前建议先执行如下命令升级pip
pip install --upgrade pip
执行如下命令安装 pxd:
pip install pxd
注: 部分国内用户从 pypi 下载包的速度较慢, 可以使用如下命令从阿里云的镜像安装: pip install -i http://mirrors.aliyun.com/pypi/simple/ pxd
准备 PolarDB-X 拓扑文件
PolarDB-X目前包含企业版和标准版两个系列,您可以根据实际的需求准备对应系列的拓扑文件。
准备 PolarDB-X 企业版拓扑文件
PolarDB-X 企业版是分布式架构集群,支持更大数据量,面向具备企业级超高并发、大规模数据复杂查询、加速分析的业务场景。
首先执行如下命令获取 PolarDB-X 各个组件的最新镜像版本(需要填入YAML文件):
curl -s "https://polardbx-opensource.oss-cn-hangzhou.aliyuncs.com/scripts/get-version.sh" | sh
输出内容如下所示(以 PolarDB-X V2.4.0 版本为例):
CN polardbx/polardbx-sql:v2.4.0_5.4.19
DN polardbx/polardbx-engine:v2.4.0_8.4.19
CDC polardbx/polardbx-cdc:v2.4.0_5.4.19
编写如下的 YAML 文件,指定 PolarDB-X 企业版集群的名称以及 GMS, CN,DN 的部署节点。比如:总共准备了3台机器10.168.0.37、10.168.0.38、10.168.0.39
- 10.168.0.37,部署gms、cdc节点
- 10.168.0.38、10.168.0.39,部署cn/dn各两个节点。其中dn下的 host_group 表示一个dn节点多副本的部署机器,比如Paxos三副本的话需要填入三个ip。
如果您的机器有多张网卡,为了保证网络的质量,建议YAML文件中使用内网IP,不要使用公网IP。
如果您的机器有多张内网网卡,建议采用
hostname -i
命令输出的IP 进行部署。hostname -i
的输出可以通过修改/etc/hosts
文件配置。
version: v1
type: polardbx
cluster:
name: pxc_test
gms:
image: polardbx/polardbx-engine:v2.4.0_8.4.19
host_group: [10.168.0.37]
cn:
image: polardbx/polardbx-sql:v2.4.0_5.4.19
replica: 2
nodes:
- host: 10.168.0.38
- host: 10.168.0.39
resources:
mem_limit: 4G
dn:
image: polardbx/polardbx-engine:v2.4.0_8.4.19
replica: 2
nodes:
- host_group: [10.168.0.38]
- host_group: [10.168.0.39]
resources:
mem_limit: 4G
cdc:
image: polardbx/polardbx-cdc:v2.4.0_5.4.19
replica: 1
nodes:
- host: 10.168.0.37
resources:
mem_limit: 4G
通过以上拓扑文件创建的 PolarDB-X 企业版集群。拓扑文件包括如下属性:
- version: 拓扑文件版本,无需修改
- type: polardbx, 无需修改
- cluster.name:PolarDB-X 集群名称
- cluster.gms.image: gms docker 镜像名称,建议填上述命令的获取到的 DN 镜像,如不填,默认为最新镜像
- cluster.gms.host_group: gms 机器 ip 列表,如果想创建单副本模式,列表中填写1个ip即可,如果想创建基于Paxos的三副本集群,列表中填3个ip即可,例如:[172.16.1.11,172.16.1.12,172.16.1.13]。三副本集群的Leader节点将从前两个ip的节点上随机选出
- cluster.cn
- image: 计算节点镜像名称,建议填上述命令的获取到的 CN 镜像,如不填,默认为最新镜像。
- replica: 计算节点数目,需要与nodes中的host数量对应
- nodes: 计算节点的ip列表
- resources: 计算节点使用的资源
- mem_limit: 内存上限,默认 2G
- cluster.dn
- image: 数据节点镜像名称,建议填上述命令的获取到的 DN 镜像,如不填,默认为最新镜像
- replica: 数据节点数目,需要与nodes中的 host_group 数量对应
- nodes: 存储节点的host_group列表,一个 host_group 表示一个dn节点多副本的部署机器,比如Paxos三副本的话需要填入三个ip,例如:[172.16.1.11,172.16.1.12,172.16.1.13]。三副本集群的Leader节点将从前两个ip的节点上随机选出
- resources: 存储节点使用的资源
- mem_limit: 内存上限,默认 2G
- cluster.cdc
- image: CDC 节点镜像名称,建议填上述命令的获取到的 CDC 镜像,如不填,默认为最新镜像
- replica: CDC 节点数目,需要与nodes中的host数量对应
- nodes: CDC 节点的ip列表
- resources: CDC 节点使用的资源
- mem_limit: 内存上限,默认 2G
注:如果创建基于 Paxos 的三副本集群,需要 pxd 版本>=0.3.0
准备 PolarDB-X 标准版拓扑文件
PolarDB-X 标准版采用一主一备一日志的三节点架构,性价比高,通过多副本同步复制,确保数据的强一致性。面向具备超高并发、复杂查询及轻量分析的在线业务场景。
注:标准版集群创建依赖 pxd版本>=0.6.0
首先执行如下命令获取 PolarDB-X 各个组件的最新镜像版本(需要填入YAML文件):
curl -s "https://polardbx-opensource.oss-cn-hangzhou.aliyuncs.com/scripts/get-version.sh" | sh
输出内容如下所示(以 PolarDB-X V2.4.0 版本为例):
CN polardbx/polardbx-sql:v2.4.0_5.4.19
DN polardbx/polardbx-engine:v2.4.0_8.4.19
CDC polardbx/polardbx-cdc:v2.4.0_5.4.19
PolarDB-X 标准版无CN、GMS与CDC,仅具有一个DN节点。编写如下的 YAML 文件,指定 PolarDB-X 标准版的名称与三节点的拓扑信息。
如果您的机器有多张网卡,为了保证网络的质量,建议YAML文件中使用内网IP,不要使用公网IP。
如果您的机器有多张内网网卡,建议采用
hostname -i
命令输出的IP 进行部署。hostname -i
的输出可以通过修改/etc/hosts
文件配置。
version: v1
type: polardbx
cluster:
name: pxc_test
dn:
image: polardbx/polardbx-engine:v2.4.0_8.4.19
replica: 1
nodes:
- host_group: [172.16.201.11,172.16.201.11,172.16.201.11]
resources:
mem_limit: 2G
通过以上拓扑文件创建的 PolarDB-X 标准版集群。拓扑文件包括如下属性:
- version: 拓扑文件版本,无需修改
- type: polardbx, 无需修改
- cluster.name:PolarDB-X 集群名称
- cluster.dn
- image: 数据节点镜像名称,建议填上述命令的获取到的 DN 镜像,如不填,默认为最新镜像
- replica: 数据节点数目,标准版中默认设置为 1
- nodes: 存储节点的host_group列表,一个 host_group 表示一个dn节点多副本的部署机器,比如Paxos三副本的话需要填入三个ip,例如:[172.16.1.11,172.16.1.12,172.16.1.13]。三副本集群的Leader节点将从前两个ip的节点上随机选出
- resources: 存储节点使用的资源
- mem_limit: 内存上限,默认 2G
创建 PolarDB-X 集群
执行如下命令,即可在集群内一键部署 PolarDB-X:
pxd create -file polardbx.yaml
部署完成后,pxd 会输出 PolarDB-X 集群的连接方式,通过 MySQL 命令行即可登录 PolarDB-X 数据库进行测试。
注:
- PolarDB-X 管理员账号的密码是随机生成的,仅出现这一次,请注意保存。
- PolarDB-X CN 本身是无状态的,企业版中会部署多个 CN 节点,任意的 CN 都可登陆执行 SQL。如需要负载均衡,可以通过负载均衡组件(如 LVS、HAProxy 或 F5 等)对外提供统一的接入地址。
通过 MySQL Client 即可连接,执行如下 SQL 初步体验 PolarDB-X 的企业版的分布式特性,PolarDB-X SQL 详情请参考:SQL 概述
注意:PolarDB-X 标准版的语法与MySQL完全一致,此处便不再列举体验SQL
# 检查GMS
select * from information_schema.schemata;
# 创建分区表
create database polarx_example partition_mode='partitioning';
use polarx_example;
create table example (
`id` bigint(11) auto_increment NOT NULL,
`name` varchar(255) DEFAULT NULL,
`score` bigint(11) DEFAULT NULL,
primary key (`id`)
) engine=InnoDB default charset=utf8
partition by hash(id)
partitions 8;
insert into example values(null,'lily',375),(null,'lisa',400),(null,'ljh',500);
select * from example;
show topology from example;
# 检查CDC
show master status ;
show binlog events in 'binlog.000001' from 4;
# 检查DN和CN
show storage ;
show mpp ;
查看 PolarDB-X 集群状态
执行如下命令查看 PolarDB-X 集群状态:
pxd list
执行如下命令可以查看 pxd 的更多指令及用法:
pxd --help