iis服务器助手广告广告
返回顶部
首页 > 资讯 > 数据库 >一种zabbix server扩容改造方案
  • 488
分享到

一种zabbix server扩容改造方案

2024-04-02 19:04:59 488人浏览 薄情痞子
摘要

本文原创作者鲍光亚,京东商城基础平台部软件开发工程师,经作者同意发表于本人博客,如需转载需经本人同意。 一、引言 随着监控量的迅速增长,zabbix管理员有一天会发现硬盘iops达到了数万,接近硬盘io的极

本文原创作者鲍光亚,京东商城基础平台部软件开发工程师,经作者同意发表于本人博客,如需转载需经本人同意。

一、引言

随着监控量的迅速增长,zabbix管理员有一天会发现硬盘iops达到了数万,接近硬盘io的极限,无力支持处理更多监控数据。本文提出一种横向扩展方案,以尽量小的改动,增加zabbix系统的数据io能力。
考虑到zabbix的数据库io主要在于history表和trends表,这一方案是在不增加zabbix server数量的情况下,将history表和trends表的io分散到其他主机上。此方案的优点是保持单个zabbix server,不需要考虑多server之间的协同一致。这一数据库分离模式还可以兼容原有的集中模式。但是,由于io分散到多个主机上,当需要读写数据时,不得不访问多个数据库实例。同时,代码中涉及数据库读写的部分,包括zabbix server和WEB api,都需要重写,好在大部分可以参考已有的代码。
本方案设计基于zabbix 3.0.10版本。本文只论及对zabbix server的改造方案,对web api的修改方案将另文讨论,本文不涉及。

二、zabbix数据读写机制

由于configuration数据的io远小于history和trends数据io,本方案没有涉及对configuration数据的改动。
cache和vc_cache是zabbix源码中的两个变量名称,前者用于存储来自agent/proxy的原始数据,后者存储的则是从数据库中加载的数据(当数据已过期时,新数据则会直接从前者复制到后者之中),用于进行trigger计算等。
1.history和trends数据的写入
poller和trapper两类进程(包括pinger)负责从agent和proxy接收history数据,然后flush到cache中,同时更新cache中的trends数据。对cache的更新主要通过函数 process_hist_data实现。
dbsyncer进程则负责将cache中的数据写入到数据库中的history表和trends表中。由于dbsyncer存在多个进程,进程之间通过进行协调,避免冲突。cache数据入库主要通过DCsync_history和DCsync_trends两个函数实现。

  1. history和trends数据的读取
    vc_cache在程序启动时分配空间,但是并不加载数据。此时poller和trapper进程尚未开始接收数据,因此也不会往vc_cache中写数据。
    程序启动以后,当需要数据进行计算时,会尝试从vc_cache中获取values,如果获取不到则会从history表中加载数据到vc_cache中。源文件中有三个函数用于从数据库读取value并加载到vc_cache中,这三个函数名为vc_db_read_values_by_time、vc_db_read_values_by_count、 vc_db_read_values_by_time_and_count。
  2. history和trends数据的删除
    housekeeper进程负责将过期的数据从history和trends表中删除。housekeeper还负责删除过期的events、alerts、sessions等。
  3. 数据库连接
    zabbix各进程对数据库的访问通过单个connection来建立连接。各个查询的执行函数都没有设置连接参数,而是通过全局性的conn变量维持连接。如果要实现对多数据库的访问,则只能增加连接变量数,或者动态修改conn。
  4. watchdog
    watchdog进程负责监视数据库状态,当发现连接失败时发送报警信息。

三、具体方案及实现

在数据库中,history表依照数据类型不同分为history、history_uint、history_str、history_text、history_log五个表,trends表则分为trends和trends_uint两个表。遵循着分散io的思路,可以考虑两种方案,第一种方案是按照类别将history和trends分散到两个独立的数据库中,另外一种是按照类别以及数据类型的不同,将每一个表都独立地存储到单个数据库中。下文主要按照第一种方案进行论述。

  1. 改写配置文件
    在配置文件中增加所需的数据库连接参数,以及用于集中和分离模式切换的开关。配置文件的解析在程序启动时进行,因此还需要修改启动程序,增加存储数据库连接参数的数组元素以及开关变量。
  2. 修改数据库connect函数
    在保留原有connect函数的基础上,新增一个带有入参的connect,以根据需要建立不同的连接。同时增加全局变量,用于保持多个连接。
  3. 修改数据库查询函数
    在保持原有查询函数的基础上,增加带有连接参数的查询函数,以动态变换查询连接。zabbix中有多个查询函数,用于不同类型的查询,所有这些都需要修改。
  4. 对函数的调用
    上文提及的涉及history和trends读写的函数中,对数据库的访问部分都需要修改,增加对模式开关的条件判断,以调用不同的函数。模式开关的逻辑应保证通过重启服务可以使数据存储模式在集中和分离模式之间切换。
    如果采用按监控数据类型分库的方案,则还需要对sql文本构造过程进行修改。
  5. 修改watchdog逻辑
    将原来的单个实例状态监视,改为多实例同时监视,有任何实例连接失败时均报警。

四、数据一致性问题

分离模式存在的风险之一是数据一致性问题。在集中模式时,zabbix通过互斥锁来协调对缓存的访问,保证缓存数据的一致性。写数据库时则通过transaction保证一致性。因为缓存锁机制的存在,数据库的分离与否并不会影响缓存的一致性,问题只能存在于数据库内部。
如果采用按类别分离的方案,即history和trends数据分别存储在两个数据库中,则需要考虑history、trends和其他表之间的一致性。如果采用按类别+数据类型分离的方案,则同时要考虑history各个表之间的数据一致性以及trends表之间的一致性。
通过分析源码中的transaction逻辑,history/trends表的更新操作不需要与其他表保持一致性(在数据库级别),在程序允许的情况下,双方可以独立写数据库。

五、进一步的方案

遵循数据库分离的思路,更激进的方案是将history和trends数据中的每一个表都进行拆分,以itemid或者clock为key按照一定的哈希算法,将数据分散存储到更多的数据库中。

您可能感兴趣的文档:

--结束END--

本文标题: 一种zabbix server扩容改造方案

本文链接: https://www.lsjlt.com/news/36125.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • oracle怎么查询当前用户所有的表
    要查询当前用户拥有的所有表,可以使用以下 sql 命令:select * from user_tables; 如何查询当前用户拥有的所有表 要查询当前用户拥有的所有表,可以使...
    99+
    2024-05-14
    oracle
  • oracle怎么备份表中数据
    oracle 表数据备份的方法包括:导出数据 (exp):将表数据导出到外部文件。导入数据 (imp):将导出文件中的数据导入表中。用户管理的备份 (umr):允许用户控制备份和恢复过程...
    99+
    2024-05-14
    oracle
  • oracle怎么做到数据实时备份
    oracle 实时备份通过持续保持数据库和事务日志的副本来实现数据保护,提供快速恢复。实现机制主要包括归档重做日志和 asm 卷管理系统。它最小化数据丢失、加快恢复时间、消除手动备份任务...
    99+
    2024-05-14
    oracle 数据丢失
  • oracle怎么查询所有的表空间
    要查询 oracle 中的所有表空间,可以使用 sql 语句 "select tablespace_name from dba_tablespaces",其中 dba_tabl...
    99+
    2024-05-14
    oracle
  • oracle怎么创建新用户并赋予权限设置
    答案:要创建 oracle 新用户,请执行以下步骤:以具有 create user 权限的用户身份登录;在 sql*plus 窗口中输入 create user identified ...
    99+
    2024-05-14
    oracle
  • oracle怎么建立新用户
    在 oracle 数据库中创建用户的方法:使用 sql*plus 连接数据库;使用 create user 语法创建新用户;根据用户需要授予权限;注销并重新登录以使更改生效。 如何在 ...
    99+
    2024-05-14
    oracle
  • oracle怎么创建新用户并赋予权限密码
    本教程详细介绍了如何使用 oracle 创建一个新用户并授予其权限:创建新用户并设置密码。授予对特定表的读写权限。授予创建序列的权限。根据需要授予其他权限。 如何使用 Oracle 创...
    99+
    2024-05-14
    oracle
  • oracle怎么查询时间段内的数据记录表
    在 oracle 数据库中查询指定时间段内的数据记录表,可以使用 between 操作符,用于比较日期或时间的范围。语法:select * from table_name wh...
    99+
    2024-05-14
    oracle
  • oracle怎么查看表的分区
    问题:如何查看 oracle 表的分区?步骤:查询数据字典视图 all_tab_partitions,指定表名。结果显示分区名称、上边界值和下边界值。 如何查看 Oracle 表的分区...
    99+
    2024-05-14
    oracle
  • oracle怎么导入dump文件
    要导入 dump 文件,请先停止 oracle 服务,然后使用 impdp 命令。步骤包括:停止 oracle 数据库服务。导航到 oracle 数据泵工具目录。使用 impdp 命令导...
    99+
    2024-05-14
    oracle
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作