(二)PXC集群常用管理

集群完整性

参数 描述
wsrep_cluster_state_uuid 集群的UUID值,在集群所有节点的值应该是相同的,有不同值的节点,说明其没有连接入集群
我们知道集群内节点是相互同步的,这意味着他们执行完了所有的相同的事务,每个事务由一个uuid来标识,所以所有节点最后执行的uuid应该是一样的
wsrep_cluster_conf_id 集群成员发生变化的数目,正常情况下所有节点上该值是一样的。如果值不同,说明该节点被临时”分区”了。当节点之间网络连接恢复的时候应该会恢复一样的值
对于一个健康的集群,所有节点的集群变化次数应该是一致的,重启数据库算2次(关闭和启动)
如果该值非常大,可能会是由于节点不断的被踢出和加入导致,需要查看
wsrep_cluster_size 集群中的节点数目,如果这个值跟预期的节点数一致,则所有的集群节点已经连接
对于一个健康的集群,所有节点查询出来的集群大小应该是一致的,应该是所有节点的个数
wsrep_cluster_status 集群节点的状态。如果不为”Primary”,说明出现”分区”或是”split-brain”状况,可能的取值为:Primary、Non-Primary、Disconnected

各节点状态

参数 描述
wsrep_ready 节点是否可以提供查询。该值为ON,则说明可以接受SQL负载。如果为Off,则需要检查wsrep_connected
wsrep_connected 节点是否连接到集群,如果该值为Off,且wsrep_ready的值也为Off,则说明该节点没有连接到集群。(可能是wsrep_cluster_address或wsrep_cluster_name等配置错造成的。具体错误需要查看错误日志)
wsrep_local_state_comment galera状态,如果wsrep_connected为On,但wsrep_ready为OFF,则可以从该项查看原因,有如下值:
Joining
Waiting on SST
Joined
Synced (一般应该为Synced,代表已同步)
Donor

复制性能状态

参数 描述
wsrep_local_recv_queue_avg 表示slave事务队列的平均长度,slave瓶颈的预兆
wsrep_flow_control_paused 表示复制停止了多长时间。即表明集群因为Slave延迟而慢的程度,值为0~1,越靠近0越好,值为1表示复制完全停止。可优化wsrep_slave_threads的值来改善
wsrep_cert_deps_distance 有多少事务可以并行应用处理。wsrep_slave_threads设置的值不应该高出该值太多

大量写状态

参数 描述
wsrep_local_send_queue_avg 网络瓶颈的预兆。如果这个值比较高的话,可能存在网络瓶
该值大于0代表,节点无法及时应用接收到的写集
wsrep_local_recv_queue_min 查看节点本地接收队列的最小值
wsrep_local_recv_queue_max 查看节点本地接收队列的最大值

wsrep相关参数含义介绍:

wsrep_local_state_uuid:存储于该节点的UUID状态

wsrep_protocol_version:wsrep协议使用的版本

wsrep_last_committed:最后提交事务的序列号

wsrep_replicated:发送到其他节点的writesets总数

wsrep_replicated_bytes:发送到其他节点的writesets总字节数

wsrep_repl_keys:复制keys总数

wsrep_repl_keys_bytes:复制keys总字节数

wsrep_repl_data_bytes:复制数据的总字节数

wsrep_repl_other_bytes:其他复制的总字节数

wsrep_received:从其他节点接收的writesets总数

wsrep_received_bytes:从其他节点接收的writesets总字节数

wsrep_local_commits:该节点提交的writesets总数

wsrep_local_cert_failures:认证测试中失败的writesets总数

wsrep_local_replays:因非对称锁粒度回放的事务数

wsrep_local_send_queue:当前发送队列的长度,表示等待被发送的writesets数

wsrep_local_send_queue_avg:网络瓶颈的预兆。如果这个值比较高的话,可能存在网络瓶

wsrep_local_recv_queue:当前接收队列的长度,表示等待被使用的writesets数

wsrep_local_recv_queue_avg:表示slave事务队列的平均长度,slave瓶颈的预兆

wsrep_local_cached_downto:gcache的最小序列号,这个变量可以用来判断是用IST,还是SST。如果此值为0,表示gcache中没有writesets

wsrep_flow_control_paused_ns:表示复制停止了多长时间,以纳秒为单位

wsrep_flow_control_paused:表示复制停止了多长时间。即表明集群因为Slave延迟而慢的程度,值为0~1,越靠近0越好,值为1表示复制完全停止。可优化wsrep_slave_threads的值来改善

wsrep_flow_control_sent:表示该节点已经停止复制了多少次

wsrep_flow_control_recv:表示该节点已经停止复制了多少次

wsrep_cert_deps_distance:有多少事务可以并行应用处理。wsrep_slave_threads设置的值不应该高出该值太多

wsrep_apply_oooe:并发执行效率,writesets应用于out-of-order的频率

wsrep_apply_oool:大序列值的writeset比小序列值的writeset多出的执行频率

wsrep_apply_window:同时使用的最高序列值和最小序列值间的平均差值

wsrep_commit_oooe:事务脱离队列的频率

wsrep_commit_window:同时提交的最大序列值和最小序列值间的平均差值

wsrep_local_state:galera状态值

1 – Joining (requesting/receiving State Transfer) –表示此节点正在加入集群

2 – Donor/Desynced –表示正在加入的节点是donor

3 – Joined –表示节点已经加入集群r

4 – Synced –表示节点已经和集群同步

wsrep_local_state_comment:galera状态,如果wsrep_connected为On,但wsrep_ready为OFF,则可以从该项查看原因

wsrep_cert_index_size:certification索引的entries数量

wsrep_cert_bucket_count:哈希表中certification索引的cells数

wsrep_gcache_pool_size:page pool或者为gcache动态分配的字节数

wsrep_causal_reads:writesets处理数

wsrep_incoming_addresses:以逗号分隔显示集群中的节点地址

wsrep_evs_repl_latency:提供集群节点间通信复制延迟信息

wsrep_evs_delayed:被剔除出集群的UUID

wsrep_evs_evict_list:有延迟的节点列表

wsrep_evs_state:EVS协议状态

wsrep_gcomm_uuid:galera的view_id,不同于集群的uuid,在gvwstate.dat可以查看到

wsrep_cluster_conf_id:集群成员发生变化的数目,正常情况下所有节点上该值是一样的。如果值不同,说明该节点被临时”分区”了。当节点之间网络连接恢复的时候应该会恢复一样的值

wsrep_cluster_size:集群中的节点数目,如果这个值跟预期的节点数一致,则所有的集群节点已经连接

wsrep_cluster_state_uuid:集群的UUID值,在集群所有节点的值应该是相同的,有不同值的节点,说明其没有连接入集群

wsrep_cluster_status:集群节点的状态。如果不为”Primary”,说明出现”分区”或是”split-brain”状况,可能的取值为:Primary、Non-Primary、Disconnected

wsrep_connected:节点是否连接到集群,如果该值为Off,且wsrep_ready的值也为Off,则说明该节点没有连接到集群。(可能是wsrep_cluster_address或wsrep_cluster_name等配置错造成的。具体错误需要查看错误日志)

wsrep_local_bf_aborts:被其他节点上的事务终止的正在执行的本地事务数

wsrep_local_index:集群节点索引

wsrep_provider_name:wsrep程序提供者

wsrep_provider_vendor:wsrep供应商

wsrep_provider_version:wsrep程序提供者的版本

wsrep_ready:节点是否可以提供查询。该值为ON,则说明可以接受SQL负载。如果为Off,则需要检查wsrep_connected

给TA打赏
共{{data.count}}人
人已打赏
未分类

nginx转发websocket

2022-5-23 20:53:55

Java算法

设计一个有getMin功能的栈

2022-8-22 23:31:01

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索