集群完整性
参数 | 描述 |
wsrep_cluster_state_uuid | 集群的UUID值,在集群所有节点的值应该是相同的,有不同值的节点,说明其没有连接入集群 我们知道集群内节点是相互同步的,这意味着他们执行完了所有的相同的事务,每个事务由一个uuid来标识,所以所有节点最后执行的uuid应该是一样的 |
wsrep_cluster_conf_id | 集群成员发生变化的数目,正常情况下所有节点上该值是一样的。如果值不同,说明该节点被临时”分区”了。当节点之间网络连接恢复的时候应该会恢复一样的值 对于一个健康的集群,所有节点的集群变化次数应该是一致的,重启数据库算2次(关闭和启动) 如果该值非常大,可能会是由于节点不断的被踢出和加入导致,需要查看 |
wsrep_cluster_size | 集群中的节点数目,如果这个值跟预期的节点数一致,则所有的集群节点已经连接 对于一个健康的集群,所有节点查询出来的集群大小应该是一致的,应该是所有节点的个数 |
wsrep_cluster_status | 集群节点的状态。如果不为”Primary”,说明出现”分区”或是”split-brain”状况,可能的取值为:Primary、Non-Primary、Disconnected |
各节点状态
参数 | 描述 |
wsrep_ready | 节点是否可以提供查询。该值为ON,则说明可以接受SQL负载。如果为Off,则需要检查wsrep_connected |
wsrep_connected | 节点是否连接到集群,如果该值为Off,且wsrep_ready的值也为Off,则说明该节点没有连接到集群。(可能是wsrep_cluster_address或wsrep_cluster_name等配置错造成的。具体错误需要查看错误日志) |
wsrep_local_state_comment | galera状态,如果wsrep_connected为On,但wsrep_ready为OFF,则可以从该项查看原因,有如下值: Joining Waiting on SST Joined Synced (一般应该为Synced,代表已同步) Donor |
复制性能状态
参数 | 描述 |
wsrep_local_recv_queue_avg | 表示slave事务队列的平均长度,slave瓶颈的预兆 |
wsrep_flow_control_paused | 表示复制停止了多长时间。即表明集群因为Slave延迟而慢的程度,值为0~1,越靠近0越好,值为1表示复制完全停止。可优化wsrep_slave_threads的值来改善 |
wsrep_cert_deps_distance | 有多少事务可以并行应用处理。wsrep_slave_threads设置的值不应该高出该值太多 |
大量写状态
参数 | 描述 |
wsrep_local_send_queue_avg | 网络瓶颈的预兆。如果这个值比较高的话,可能存在网络瓶 该值大于0代表,节点无法及时应用接收到的写集 |
wsrep_local_recv_queue_min | 查看节点本地接收队列的最小值 |
wsrep_local_recv_queue_max | 查看节点本地接收队列的最大值 |
wsrep相关参数含义介绍:
wsrep_local_state_uuid:存储于该节点的UUID状态
wsrep_protocol_version:wsrep协议使用的版本
wsrep_last_committed:最后提交事务的序列号
wsrep_replicated:发送到其他节点的writesets总数
wsrep_replicated_bytes:发送到其他节点的writesets总字节数
wsrep_repl_keys:复制keys总数
wsrep_repl_keys_bytes:复制keys总字节数
wsrep_repl_data_bytes:复制数据的总字节数
wsrep_repl_other_bytes:其他复制的总字节数
wsrep_received:从其他节点接收的writesets总数
wsrep_received_bytes:从其他节点接收的writesets总字节数
wsrep_local_commits:该节点提交的writesets总数
wsrep_local_cert_failures:认证测试中失败的writesets总数
wsrep_local_replays:因非对称锁粒度回放的事务数
wsrep_local_send_queue:当前发送队列的长度,表示等待被发送的writesets数
wsrep_local_send_queue_avg:网络瓶颈的预兆。如果这个值比较高的话,可能存在网络瓶
wsrep_local_recv_queue:当前接收队列的长度,表示等待被使用的writesets数
wsrep_local_recv_queue_avg:表示slave事务队列的平均长度,slave瓶颈的预兆
wsrep_local_cached_downto:gcache的最小序列号,这个变量可以用来判断是用IST,还是SST。如果此值为0,表示gcache中没有writesets
wsrep_flow_control_paused_ns:表示复制停止了多长时间,以纳秒为单位
wsrep_flow_control_paused:表示复制停止了多长时间。即表明集群因为Slave延迟而慢的程度,值为0~1,越靠近0越好,值为1表示复制完全停止。可优化wsrep_slave_threads的值来改善
wsrep_flow_control_sent:表示该节点已经停止复制了多少次
wsrep_flow_control_recv:表示该节点已经停止复制了多少次
wsrep_cert_deps_distance:有多少事务可以并行应用处理。wsrep_slave_threads设置的值不应该高出该值太多
wsrep_apply_oooe:并发执行效率,writesets应用于out-of-order的频率
wsrep_apply_oool:大序列值的writeset比小序列值的writeset多出的执行频率
wsrep_apply_window:同时使用的最高序列值和最小序列值间的平均差值
wsrep_commit_oooe:事务脱离队列的频率
wsrep_commit_window:同时提交的最大序列值和最小序列值间的平均差值
wsrep_local_state:galera状态值
1 – Joining (requesting/receiving State Transfer) –表示此节点正在加入集群
2 – Donor/Desynced –表示正在加入的节点是donor
3 – Joined –表示节点已经加入集群r
4 – Synced –表示节点已经和集群同步
wsrep_local_state_comment:galera状态,如果wsrep_connected为On,但wsrep_ready为OFF,则可以从该项查看原因
wsrep_cert_index_size:certification索引的entries数量
wsrep_cert_bucket_count:哈希表中certification索引的cells数
wsrep_gcache_pool_size:page pool或者为gcache动态分配的字节数
wsrep_causal_reads:writesets处理数
wsrep_incoming_addresses:以逗号分隔显示集群中的节点地址
wsrep_evs_repl_latency:提供集群节点间通信复制延迟信息
wsrep_evs_delayed:被剔除出集群的UUID
wsrep_evs_evict_list:有延迟的节点列表
wsrep_evs_state:EVS协议状态
wsrep_gcomm_uuid:galera的view_id,不同于集群的uuid,在gvwstate.dat可以查看到
wsrep_cluster_conf_id:集群成员发生变化的数目,正常情况下所有节点上该值是一样的。如果值不同,说明该节点被临时”分区”了。当节点之间网络连接恢复的时候应该会恢复一样的值
wsrep_cluster_size:集群中的节点数目,如果这个值跟预期的节点数一致,则所有的集群节点已经连接
wsrep_cluster_state_uuid:集群的UUID值,在集群所有节点的值应该是相同的,有不同值的节点,说明其没有连接入集群
wsrep_cluster_status:集群节点的状态。如果不为”Primary”,说明出现”分区”或是”split-brain”状况,可能的取值为:Primary、Non-Primary、Disconnected
wsrep_connected:节点是否连接到集群,如果该值为Off,且wsrep_ready的值也为Off,则说明该节点没有连接到集群。(可能是wsrep_cluster_address或wsrep_cluster_name等配置错造成的。具体错误需要查看错误日志)
wsrep_local_bf_aborts:被其他节点上的事务终止的正在执行的本地事务数
wsrep_local_index:集群节点索引
wsrep_provider_name:wsrep程序提供者
wsrep_provider_vendor:wsrep供应商
wsrep_provider_version:wsrep程序提供者的版本
wsrep_ready:节点是否可以提供查询。该值为ON,则说明可以接受SQL负载。如果为Off,则需要检查wsrep_connected