iis服务器助手广告广告
返回顶部
首页 > 资讯 > 数据库 >详细记录一次stampstime字段引起pxc集群脑裂
  • 925
分享到

详细记录一次stampstime字段引起pxc集群脑裂

详细记录一次stampstime字段引起pxc集群脑裂 2018-12-23 22:12:29 925人浏览 猪猪侠
摘要

事故回顾 运维执行导入sql,导入后收到master2和master3节点宕机的报警; 检查集群状态发现master1进入初始化模式,无法读写;master2和master3已经下线; 处理方法 分别进入3个master节点,发现mast

详细记录一次stampstime字段引起pxc集群脑裂

事故回顾

运维执行导入sql,导入后收到master2和master3节点宕机的报警;
检查集群状态发现master1进入初始化模式,无法读写;master2和master3已经下线;

处理方法

分别进入3个master节点,发现master2和master3两个节点已经退出;
master1节点可以进入,使用命令show global status like "wsrep_local_state_comment";查看发现集群进入Initialized状态,集群不能读写;
重启master1节点,重启完成后,节点恢复读写,业务恢复正常;
逐个启动master2和master3节点,恢复集群的状态;
注1:master2和master3数据同步时可能会存在表造成集群不可访问,所以建议在业务低峰时恢复业务;
注2:如果master2和master3下线时间过长,可能触发全量同步;
注3:建议将数据库的wsrep_sst_method参数值改为xtrabackup,可用方法有Mysqldump、rsync和xtrabackup,前两者在传输时都需要对Donor加全局只读锁(FLUSH TABLES WITH READ LOCK),xtrabackup则不需要(它使用percona自己提供的backup lock);

事故原因

业务需求从beta导一个表结构到生产,运维导出时漏加了--skip-tz-utc参数,导致使用了mysqldump的默认值--tz-utc;
导出的sql中会增加一个将session改为utc时区(+00:00)的设置,并将timestamp字段的时间同步减8小时(由+8:00时区改为+00:00);
将这个sql导入pxc集群时,master1导入成功。当这个操作同步到另外2个pxc节点时,session中的时区设置并不会同步,造成导入sql的时间比实际少了8小时;
我们导入的表默认时间为1970:08:01,时间减少后变成了1970:00:01,超过了cts时区(+08:00)timestamp字段允许的最小值(1970:08:00),建表失败;
master2和3数据跟master1不一致,节点下线。master1发现只有自己最后1个节点存在,认为集群失效,变为初始化状态,pxc集群无法读写;

后续处理与防范

使用脚本来操作数据库的导入导出,避免人为因素导致集群异常;
排期配置和验证允许脏读,让集群出问题时,数据库至少能提供查询服务。这个需要考虑业务是否支持;

您可能感兴趣的文档:

--结束END--

本文标题: 详细记录一次stampstime字段引起pxc集群脑裂

本文链接: https://www.lsjlt.com/news/9023.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • redis分布式锁怎么释放
    如何释放 redis 分布式锁 Redis 分布式锁是一种用于在分布式系统中协调对共享资源的访问的技术。释放分布式锁至关重要,因为它可以确保资源在使用后被正确释放,从而防止死锁和数据不一...
    99+
    2024-05-21
    redis
  • redis击穿怎么处理
    redis 击穿的处理方法:使用分布式锁加锁,确保仅一个请求创建 key;启用缓存穿透策略,返回默认值或错误消息;异步创建 key,避免影响主线程性能;预加载热点 key;优化 redi...
    99+
    2024-05-21
    redis
  • redis有序集合怎么实现
    redis有序集合(zset)通过哈希表和跳跃表实现,哈希表存储元素和分数映射,而跳跃表按分数排序元素并维护快速导航的指针,支持多种操作,包括添加、删除、更新分数、查找元素和获取排名,优...
    99+
    2024-05-21
    redis
  • redis哨兵模式怎么用
    redis 哨兵模式是一种高可用性解决方案,通过部署哨兵服务器来实现故障检测和自动故障转移。使用步骤包括:部署哨兵服务器、配置 redis 实例、启动哨兵服务器。哨兵模式工作原理:检测主...
    99+
    2024-05-21
    redis
  • 怎么查看redis是否启动
    检查 redis 是否已启动的最简单方法是使用 redis-cli 命令行工具,命令为: redis-cli -h -p 。除了 redis-cli,还可通过检查端口、查看进程或使用 ...
    99+
    2024-05-21
    redis
  • redis内存满了怎么办
    当redis内存已满时:清理不需要的数据增加redis实例的内存大小使用持久化优化数据结构减少客户端连接监控和调整 Redis内存已满的解决办法 当Redis的内存被占满时,会出现性能...
    99+
    2024-05-21
    redis 内存占用 数据丢失
  • redis多线程怎么用
    redis 支持多线程操作,以提高并发性和吞吐量。使用pubsub机制,可以在线程之间发送和接收消息;通过线程池,可以高效分配和管理预先创建的线程。注意事项包括线程安全、使用相同redi...
    99+
    2024-05-21
    redis
  • redis主从模式怎么切换
    redis 主从模式切换有两种方法:直接切换和 redis-sentinel 辅助切换。直接切换需要手动操作,包括停用主服务器、同步数据、解除关联和连接新主节点。redis-sentin...
    99+
    2024-05-21
    redis
  • redis怎么迁移数据
    redis 提供多种数据迁移方式:redis 复制:启用复制功能,将数据同步到目标服务器。redis rdb 导出和导入:创建 rdb 文件,将其从源服务器复制到目标服务器,然后加载。r...
    99+
    2024-05-21
    redis
  • redis哨兵怎么用
    redis 哨兵是一种 redis 服务的高可用性解决方案,通过监视 redis 实例并进行故障转移来确保服务的可用性。它需要安装 redis 哨兵并配置 sentinel.conf 文...
    99+
    2024-05-21
    redis
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作