通过 PXD 部署集群

PXD 是 PolarDB-X 的部署工具,除了支持在本地一键快速拉起测试环境外,也支持在 Linux 集群中通过指定的拓扑的方式部署 PolarDB-X 分布式数据库。

系统配置

  1. 每台机器磁盘空间>=100G,建议磁盘类型为 SSD。
  2. 集群内的所有机器都能访问互联网。

    如果您使用的是阿里云ECS,可以参考文档:连接公网概述 为云服务器开通访问互联网的能力。

  3. 关闭所有机器的防火墙。
  4. 在集群内的所有机器上安装 Docker,参考文档:https://docs.docker.com/engine/install/

    注:集群模式下,docker engine 版本需要大于等于18.04。

    安装完成后执行 docker ps 命令验证。如果遇到报错:"Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock: Get http:///var/run/docker.sock/v1.26/images/json: dial unix /var/run/docker.sock: connect: permission denied",请参考:非root用户如何获取docker权限

    如果您在阿里云ECS部署,建议执行docker info检查 docker registry mirror配置,将其切换成上交的镜像源:docker.mirrors.sjtug.sjtu.edu.cn

  5. 集群机器建配置免密登录。选择任意一台机器作为部署机,配置部署机到集群所有机器的免密登录

    如果您的机器有多张网卡,为了保证网络的质量,建议使用内网网卡的ip进行免密配置,不要使用公网ip。

    如果您的机器有多张内网网卡,建议采用 hostname -i 命令输出的ip 进行部署。 hostname -i 的输出可以通过修改 /etc/hosts 文件配置。

# 生成密钥对
ssh-keygen -t rsa

# 复制免登公钥到目标机器,修改user和ip
# 部署机也需要能免密登录自己
ssh-copy-id {user}@{ip}


# 例如集群中有如下三台机器:
#192.168.1.100 # PXD 部署机
#192.168.1.101
#192.168.1.102

# 则需要在192.168.1.100 上执行如下命令完成免密配置:
ssh-keygen -t rsa

ssh-copy-id {user}@192.168.1.100
ssh-copy-id {user}@192.168.1.101
ssh-copy-id {user}@192.168.1.102

在部署机上安装 PXD

选择任意一台机器作为部署机,在这台机器上安装 PXD 即可。PXD 会通过部署机在集群内创建 PolarDB-X 数据库。

准备工作

1.安装 Python3

如果你的机器上已经安装了 python3,可以跳过

检查命令:which python3,如果有返回则代表python3已安装

Red Hat, CentOS or Fedora:

yum update -y
yum install -y python3

Debian or Ubuntu:

apt-get update
apt-get install python3.7

2.创建一个 Python3 的 virtual environment 环境并激活

python3 -m venv venv
source venv/bin/activate

推荐使用 virtual environment 安装 PXD 工具

安装 PXD

安装前建议先执行如下命令升级pip

pip install --upgrade pip

执行如下命令安装 pxd:

pip install pxd

注: 部分国内用户从 pypi 下载包的速度较慢, 可以使用如下命令从阿里云的镜像安装: pip install -i http://mirrors.aliyun.com/pypi/simple/ pxd

准备 PolarDB-X 拓扑文件

PolarDB-X目前包含企业版和标准版两个系列,您可以根据实际的需求准备对应系列的拓扑文件。

准备 PolarDB-X 企业版拓扑文件

PolarDB-X 企业版是分布式架构集群,支持更大数据量,面向具备企业级超高并发、大规模数据复杂查询、加速分析的业务场景。

首先执行如下命令获取 PolarDB-X 各个组件的最新镜像版本(需要填入YAML文件):

curl -s "https://polardbx-opensource.oss-cn-hangzhou.aliyuncs.com/scripts/get-version.sh" | sh

输出内容如下所示(以 PolarDB-X V2.4.0 版本为例):

CN polardbx/polardbx-sql:v2.4.0_5.4.19
DN polardbx/polardbx-engine:v2.4.0_8.4.19
CDC polardbx/polardbx-cdc:v2.4.0_5.4.19

编写如下的 YAML 文件,指定 PolarDB-X 企业版集群的名称以及 GMS, CN,DN 的部署节点。比如:总共准备了3台机器10.168.0.37、10.168.0.38、10.168.0.39

  1. 10.168.0.37,部署gms、cdc节点
  2. 10.168.0.38、10.168.0.39,部署cn/dn各两个节点。其中dn下的 host_group 表示一个dn节点多副本的部署机器,比如Paxos三副本的话需要填入三个ip。

    如果您的机器有多张网卡,为了保证网络的质量,建议YAML文件中使用内网IP,不要使用公网IP。

    如果您的机器有多张内网网卡,建议采用 hostname -i 命令输出的IP 进行部署。 hostname -i 的输出可以通过修改 /etc/hosts 文件配置。

version: v1
type: polardbx
cluster:
  name: pxc_test
  gms:
    image: polardbx/polardbx-engine:v2.4.0_8.4.19
    host_group: [10.168.0.37]
  cn:
    image: polardbx/polardbx-sql:v2.4.0_5.4.19
    replica: 2
    nodes:
      - host: 10.168.0.38
      - host: 10.168.0.39
    resources:
      mem_limit: 4G
  dn:
    image: polardbx/polardbx-engine:v2.4.0_8.4.19
    replica: 2
    nodes:
      - host_group: [10.168.0.38]
      - host_group: [10.168.0.39]
    resources:
      mem_limit: 4G
  cdc:
    image: polardbx/polardbx-cdc:v2.4.0_5.4.19
    replica: 1
    nodes:
      - host: 10.168.0.37
    resources:
      mem_limit: 4G

通过以上拓扑文件创建的 PolarDB-X 企业版集群。拓扑文件包括如下属性:

  • version: 拓扑文件版本,无需修改
  • type: polardbx, 无需修改
  • cluster.name:PolarDB-X 集群名称
  • cluster.gms.image: gms docker 镜像名称,建议填上述命令的获取到的 DN 镜像,如不填,默认为最新镜像
  • cluster.gms.host_group: gms 机器 ip 列表,如果想创建单副本模式,列表中填写1个ip即可,如果想创建基于Paxos的三副本集群,列表中填3个ip即可,例如:[172.16.1.11,172.16.1.12,172.16.1.13]。三副本集群的Leader节点将从前两个ip的节点上随机选出
  • cluster.cn
    • image: 计算节点镜像名称,建议填上述命令的获取到的 CN 镜像,如不填,默认为最新镜像。
    • replica: 计算节点数目,需要与nodes中的host数量对应
    • nodes: 计算节点的ip列表
    • resources: 计算节点使用的资源
      • mem_limit: 内存上限,默认 2G
  • cluster.dn
    • image: 数据节点镜像名称,建议填上述命令的获取到的 DN 镜像,如不填,默认为最新镜像
    • replica: 数据节点数目,需要与nodes中的 host_group 数量对应
    • nodes: 存储节点的host_group列表,一个 host_group 表示一个dn节点多副本的部署机器,比如Paxos三副本的话需要填入三个ip,例如:[172.16.1.11,172.16.1.12,172.16.1.13]。三副本集群的Leader节点将从前两个ip的节点上随机选出
    • resources: 存储节点使用的资源
      • mem_limit: 内存上限,默认 2G
  • cluster.cdc
    • image: CDC 节点镜像名称,建议填上述命令的获取到的 CDC 镜像,如不填,默认为最新镜像
    • replica: CDC 节点数目,需要与nodes中的host数量对应
    • nodes: CDC 节点的ip列表
    • resources: CDC 节点使用的资源
      • mem_limit: 内存上限,默认 2G

注:如果创建基于 Paxos 的三副本集群,需要 pxd 版本>=0.3.0

准备 PolarDB-X 标准版拓扑文件

PolarDB-X 标准版采用一主一备一日志的三节点架构,性价比高,通过多副本同步复制,确保数据的强一致性。面向具备超高并发、复杂查询及轻量分析的在线业务场景。

注:标准版集群创建依赖 pxd版本>=0.6.0

首先执行如下命令获取 PolarDB-X 各个组件的最新镜像版本(需要填入YAML文件):

curl -s "https://polardbx-opensource.oss-cn-hangzhou.aliyuncs.com/scripts/get-version.sh" | sh

输出内容如下所示(以 PolarDB-X V2.4.0 版本为例):

CN polardbx/polardbx-sql:v2.4.0_5.4.19
DN polardbx/polardbx-engine:v2.4.0_8.4.19
CDC polardbx/polardbx-cdc:v2.4.0_5.4.19

PolarDB-X 标准版无CN、GMS与CDC,仅具有一个DN节点。编写如下的 YAML 文件,指定 PolarDB-X 标准版的名称与三节点的拓扑信息。

如果您的机器有多张网卡,为了保证网络的质量,建议YAML文件中使用内网IP,不要使用公网IP。

如果您的机器有多张内网网卡,建议采用 hostname -i 命令输出的IP 进行部署。 hostname -i 的输出可以通过修改 /etc/hosts 文件配置。

version: v1
type: polardbx
cluster:
  name: pxc_test
  dn:
    image: polardbx/polardbx-engine:v2.4.0_8.4.19
    replica: 1
    nodes:
      - host_group: [172.16.201.11,172.16.201.11,172.16.201.11]
    resources:
      mem_limit: 2G

通过以上拓扑文件创建的 PolarDB-X 标准版集群。拓扑文件包括如下属性:

  • version: 拓扑文件版本,无需修改
  • type: polardbx, 无需修改
  • cluster.name:PolarDB-X 集群名称
  • cluster.dn
    • image: 数据节点镜像名称,建议填上述命令的获取到的 DN 镜像,如不填,默认为最新镜像
    • replica: 数据节点数目,标准版中默认设置为 1
    • nodes: 存储节点的host_group列表,一个 host_group 表示一个dn节点多副本的部署机器,比如Paxos三副本的话需要填入三个ip,例如:[172.16.1.11,172.16.1.12,172.16.1.13]。三副本集群的Leader节点将从前两个ip的节点上随机选出
    • resources: 存储节点使用的资源
      • mem_limit: 内存上限,默认 2G

创建 PolarDB-X 集群

执行如下命令,即可在集群内一键部署 PolarDB-X:

pxd create -file polardbx.yaml

如果您因网络问题无法拉取docker镜像,建议使用PolarDB-X的私有镜像仓库,详见:私有镜像仓库说明

部署完成后,pxd 会输出 PolarDB-X 集群的连接方式,通过 MySQL 命令行即可登录 PolarDB-X 数据库进行测试。

PXD 创建 PolarDB-X 集群

注:

  • PolarDB-X 管理员账号的密码是随机生成的,仅出现这一次,请注意保存。
  • PolarDB-X CN 本身是无状态的,企业版中会部署多个 CN 节点,任意的 CN 都可登陆执行 SQL。如需要负载均衡,可以通过负载均衡组件(如 LVS、HAProxy 或 F5 等)对外提供统一的接入地址。

通过 MySQL Client 即可连接,执行如下 SQL 初步体验 PolarDB-X 的企业版的分布式特性,PolarDB-X SQL 详情请参考:SQL 概述

注意:PolarDB-X 标准版的语法与MySQL完全一致,此处便不再列举体验SQL

# 检查GMS 
select * from information_schema.schemata;

# 创建分区表
create database polarx_example partition_mode='partitioning';

use polarx_example;

create table example (
  `id` bigint(11) auto_increment NOT NULL,
  `name` varchar(255) DEFAULT NULL,
  `score` bigint(11) DEFAULT NULL,
  primary key (`id`)
) engine=InnoDB default charset=utf8 
partition by hash(id) 
partitions 8;

insert into example values(null,'lily',375),(null,'lisa',400),(null,'ljh',500);

select * from example;

show topology from example;

# 检查CDC
show master status ;
show binlog events in 'binlog.000001' from 4;


# 检查DN和CN
show storage ;  
show mpp ;

查看 PolarDB-X 集群状态

执行如下命令查看 PolarDB-X 集群状态:

pxd list

PXD list 结果

执行如下命令可以查看 pxd 的更多指令及用法:

pxd --help

results matching ""

    No results matching ""