iis服务器助手广告广告
返回顶部
首页 > 资讯 > 数据库 >使用Kettle定时从数据库A同步数据到数据库B
  • 382
分享到

使用Kettle定时从数据库A同步数据到数据库B

数据库mysql 2023-08-24 15:08:13 382人浏览 安东尼
摘要

一、需求背景 由于项目场景原因,需要将A库(Mysql)中的表a、表b、表c中的数据定时T+1 增量的同步到B库(mysql)。这里说明一下,不是数据库的主从备份,就是普通的数据同步。经过技术调研,发现Kettle挺合适的,原因如下: Ke

一、需求背景

由于项目场景原因,需要将A库(Mysql)中的表a、表b、表c中的数据定时T+1 增量的同步到B库(mysql)。这里说明一下,不是数据库的主从备份,就是普通的数据同步。经过技术调研,发现Kettle挺合适的,原因如下:

  1. Kettle (数据抽取、清洗、转换、装载)是由java 编写,可以在 Window、linux、Unix 上运行。支持多数据源, 多种中间件的专业ETL 工具
  2. 可视化界面支持图形化GUI设计界面,组件多样性,支持组件拖拉拽,不用写额外的代码;
  3. Kettle的流程图本质上都是配置文件,如.ktr/.kjb文件。这种设计的好处就是,当我们把转换流程图画完之后,可以直接复制到另外一个环境中运行,如:在Windows电脑上画好流程图,复制到Liunx系统上运行
  4. 免费、组件多、支持开源,一般处理T+1的数据同步是没有问题的。如果并发高、实时性高、数据量大就建议使用flink了。

二、使用方式

1. 安装包下载

官网地址:https://sourceforge.net/projects/pentaho/files/Data%20Integration/

2. 启动方式

windows点击Spoon.bat启动

出现以下图片表示正在启动,如果一直没有反应,使用管理员身份运行

主界面如下:

三、连接Mysql数据库

1. 准备MySQL连接驱动jar

由于Kettle自身是不带任何数据库驱动包的,所以这里我们需要先自己准备好驱动包,版本最好选择5.1.49。下载好jar包后,拷贝到lib目录下(Windows和Linux同理)。如果已经启动了Kettle,则需要关掉重新启动,否则驱动包不会被加载。

2. 创建数据源

依次点击:转换——>主对象树——>DB连接——>点击新建——>测试

同上操作,创建好两个数据源:源数据库、目标库;目标就是将源数据库中的表数据同步到目标库中去

3. 配置转换流程

① 加入输入节点:转换——>输入——>表输入

② 双击输入节点打开配置页,输入一下信息

这里因为我是定时T+1 增量同步数据,所以我加了个同步条件WHERE gmt_create >= CURDATE() 表示该数据创建时间大于当天才会进行查询。

点击预览,正好有一条数据

③加入转换节点:转换——>插入/更新——>按住shift建立连接

④ 双击插入/更新节点,打开配置页

⑤ 点击运行测试

四、复制ktr文件到Liunx上定时运行

在Linux上,ktr文件使用Kettle的pan.sh脚本运行,命令大致如下:
sh /home/admin/kettle/data-integration/pan.sh -file=/home/admin/kettle/ktr/table_transfer.ktr -norep

为了实现定时执行这个脚本,我打算用Linux自带的corntab功能设置定时。

首先我编写了一个shell脚本,命名为cornSql.sh,用于保存ktr的执行命令,内容如下:

#!/bin/bash export KETTLE_HOME=/home/admin/kettle/data-integrationexport JAVA_HOME=/usr/java/jdk1.8.0_131export CLASSPATH=.:${JAVA_HOME}/jre/lib/rt.jar:${JAVA_HOME}/lib/dt.jar:${JAVA_HOME}/lib/tools.jarexport PATH=$PATH:${JAVA_HOME}/bin:${KETTLE_HOME}export JRE_HOME=${JAVA_HOME}/jreTIME=$(date "+%Y%m%d")sh /home/admin/kettle/data-integration/pan.sh -file=/home/admin/kettle/ktr/table_transfer.ktr -norep >>/home/admin/kettle/log/transfer-"$TIME".log

其次,将ktr脚本拷贝到指定目录下,也就是/home/admin/kettle/ktr目录下,输入crontab -e命令打开指令界面,输入0 1 * * * /home/admin/kettle/cornSql.sh指令,这句话的意思是每天凌晨1点定时执行cornSql.sh脚本

为了检查定时配置是否生效,这里可以使用 crontab -l -u root命令,如果刚才的定时指令有打印出来,则证明配置生效。

最后,第二天检查一下执行日志文件有没有生成,在/home/admin/kettle/log目录下,这里我把每天执行的日期打印出来了,如下图:

来源地址:https://blog.csdn.net/weixin_33005117/article/details/129998959

您可能感兴趣的文档:

--结束END--

本文标题: 使用Kettle定时从数据库A同步数据到数据库B

本文链接: https://www.lsjlt.com/news/379562.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 使用Kettle定时从数据库A同步数据到数据库B
    一、需求背景 由于项目场景原因,需要将A库(MySQL)中的表a、表b、表c中的数据定时T+1 增量的同步到B库(MySQL)。这里说明一下,不是数据库的主从备份,就是普通的数据同步。经过技术调研,发现Kettle挺合适的,原因如下: Ke...
    99+
    2023-08-24
    数据库 mysql
  • MySQL数据库之主从同步
    一、概述:MYSQL主从同步架构是目前使用最多的数据库架构之一,主从同步使得数据可以从一个数据库服务器复制到其他服务器上,在复制数据时,一个服务器充当主服务器(master),其余的服务器充当从服务器(sl...
    99+
    2022-10-18
  • MariaDB、MySQL数据库主从同步
    1、Mysql主从同步异步概念    异步:主服务器写完日志后立即返回同步完成消息,不受从服务器的状态和影响,mysql默认为异步工作模式  &n...
    99+
    2022-10-18
  • 如何进行mysql数据库主从同步中数据库同步配置
    这篇文章给大家介绍如何进行mysql数据库主从同步中数据库同步配置,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。背景: 最近有一个mysql数据库同步的需求,我用了mysql主从同步的...
    99+
    2022-10-18
  • oracle数据库怎么同步到另一个数据库
    要将Oracle数据库同步到另一个数据库,可以使用以下方法:1. 数据库备份和还原:在源数据库中进行全量备份,然后将备份文件复制到目...
    99+
    2023-09-17
    oracle数据库 数据库
  • 使用datax实现增量同步mysql数据库数据(定时任务)
    使用datax来做数据全量同步很简单,增量同步该怎样做呢,接下来就一起试试吧 下载datax(前提CentOS已安装jdk等运行环境),解压(路径自定),使用centos7自带的python执行datax.py,运行自检 wget http...
    99+
    2023-09-22
    python json 开发语言 数据库
  • Java实现同步枚举类数据到数据库
    本文实例为大家分享了Java同步枚举类数据到数据库的具体实现代码,供大家参考,具体内容如下 1.需求说明: 我们在开发中常常会用到数据字典,后端程序中也会经常用到(一般是用枚举类来存...
    99+
    2022-11-13
    Java同步枚举类数据到数据库 Java同步枚举类数据 Java同步数据到数据库
  • Qt数据库应用之通用数据库同步
    目录一、前言二、功能特点三、体验地址四、效果图五、相关代码一、前言 数据库同步的主要功能是将本地的数据库记录同步到远程的数据库,其中数据库类型不限,比如本地是sqlite数据库,远程...
    99+
    2022-11-13
  • Mysql数据库的主从同步配置
    目录Mysql主从同步配置1、安装两个 mysql 2、编写mysql配置文件3、初始化数据4、其他mysql 相关命令Mysql主从同步配置 配置准备: 需要两个数据库...
    99+
    2022-11-12
  • DB数据同步到数据仓库的示例分析
    这篇文章给大家分享的是有关DB数据同步到数据仓库的示例分析的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。背景在数据仓库建模中,未经任何加工处理的原始业务层数据,我们称之为ODS(...
    99+
    2022-10-18
  • 定时任务备份mysql数据库,同时备份多个数据库
    编写备份数据库的shell脚本 创建脚本 mkdir -p /root/mysql_dump/data cd /root/mysql_dump vim mysql_back.sh 脚本内容如下 #!/bin/sh # File: ...
    99+
    2018-09-25
    定时任务备份mysql数据库,同时备份多个数据库
  • 从32位数据库还原到64bit数据库open的时候报错
    RMAN> alter database open resetlogs;   database opened RMAN-06...
    99+
    2022-10-18
  • 如何使用$.get()根据选项的不同从数据库异步请求数据
    这篇文章给大家介绍如何使用$.get()根据选项的不同从数据库异步请求数据,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。 Ajax极大地改善了用户体验,对...
    99+
    2022-10-19
  • mysql5.5.42指定数据库同步操作
    环境说明:需求是创建主从复制环境,要求master端只同步主库中的drsj库到 slave端 master端IP:192.168.1.100 slave端IP:192.168.1.200 主从复制条件:...
    99+
    2022-10-18
  • MYSQL数据库怎么设置主从同步
    本篇文章为大家展示了MYSQL数据库怎么设置主从同步,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。1、配置主数据库主master : 192.168.1.132从slave : 192.168.1....
    99+
    2023-06-29
  • Zabbix 检测Mysql数据库的主从同步
    Zabbix 检测Mysql数据库的主从同步在高并发网站架构中,MySQL数据库主从同步是不可或缺的,不过经常会发生由于网络原因或者操作错误,MySQL主从经常会出现不同步的情况,那么如何监控MySQL主从...
    99+
    2022-10-18
  • Linux下Mongodb数据库主从同步配置
    说明:有两台已经安装完成的Mongodb数据库服务器,现在需要把一台设置为主库,另一台设置为从库,实现主从同步。操作系统:CentOS 7.0 64位MongoDB数据库版本:mongodb-linux-x...
    99+
    2022-10-18
  • linux下mysql数据库主从同步配置
    说明:操作系统:CentOS 5.x 64位MySQL数据库版本:mysql-5.5.35MySQL主服务器:192.168.21.128MySQL从服务器:192.168.21.129准备篇:说明:在两台...
    99+
    2022-10-18
  • Mysql数据库主从同步简单配置
    一、主从同步:(A--->B) master:192.168.71.128slave:192.168.71.138 1、Master配置:vi /etc/my.cnfserver-...
    99+
    2022-10-18
  • MYSQL数据库如何设置主从同步
    目录1、配置主数据库2、配置从数据库总结MYSQL可以配置1个主数据库多个从数据库 1、配置主数据库 主master : 192.168.1.132 从slave : 192.168...
    99+
    2022-11-13
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作