当前位置: 首页 > news >正文

中移建设有限公司网站/企业营销策划论文

中移建设有限公司网站,企业营销策划论文,wordpress 通用代码,深圳加盟网站建设Apache SeaTunnel 起到的主要作用是什么? 目前,大数据体系里有各种各样的数据引擎,有大数据生态的 Hadoop、Hive、Kudu、Kafka、HDFS,也有泛大数据库体系的 MongoDB、Redis、ClickHouse、Doris,更有云上的 AWS S3、Re…
  • Apache SeaTunnel 起到的主要作用是什么?

目前,大数据体系里有各种各样的数据引擎,有大数据生态的 Hadoop、Hive、Kudu、Kafka、HDFS,也有泛大数据库体系的 MongoDB、Redis、ClickHouse、Doris,更有云上的 AWS S3、Redshift、BigQuery、Snowflake,还有各种各样数据生态 MySQL、PostgresSQL、IoTDB、TDEngine、Salesforce、Workday 等。我们需要工具让这些数据之间能互联互通,那么 Apache SeaTunnel 就是打通这些复杂数据源的利器,它可以简单、准确、实时地把各种数据源整合到目标数据源当中,成为大数据流动的“高速公路”。

简单理解:数据库同步工具,类似阿里的canal

本文介绍使用seaTunnel的MYSQL-CDC方式进行mysql与mysql相互同步


seaTunnel官网:https://seatunnel.apache.org

  • 依赖:Java8+,hazelcast-5.0.1

安装hazelcast-5.0.1

wget https://repository.hazelcast.com/rpm/stable/hazelcast-rpm-stable.repo -O hazelcast-rpm-stable.repo
sudo mv hazelcast-rpm-stable.repo /etc/yum.repos.d/
sudo yum install hazelcast-5.0.1

下载seaTunnel

创建目录

mkdir -p /home/seatunnel

cd /home/seatunnel

执行:

export version="2.3.1"
wget "https://archive.apache.org/dist/incubator/seatunnel/${version}/apache-seatunnel-incubating-${version}-bin.tar.gz"
tar -xzvf "apache-seatunnel-incubating-${version}-bin.tar.gz"

创建执行上下文

vim /etc/profile.d/seatunnel.sh

输入

export SEATUNNEL_HOME=/home/seatunnel/apache-seatunnel-incubating-2.3.1
export PATH=$PATH:$SEATUNNEL_HOME/bin

生效配置

source /etc/profile

打开:$SEATUNNEL_HOME/bin/seatunnel-cluster.sh

在第一行添加JVM配置

JAVA_OPTS="-Xms2G -Xmx2G"

安装插件:

cd apache-seatunnel-incubating-2.3.1/config

mv plugin_config plugin_config.bak

vim plugin_config

输入以下内容:

--connectors-v2--
connector-cdc-mysql
connector-jdbc
connector-starrocks
--end--

需要其它插件可以从plugin_config.bak中挑选

保存后执行命令安装插件:

sh bin/install-plugin.sh 2.3.1

添加mysql驱动

mkdir -p /home/seatunnel/apache-seatunnel-incubating-2.3.1/plugins/jdbc/lib/

mysql-connector-java-8.0.30.jar放到plugins/jdbc/lib/目录中

mysql-connector-java-8.0.30.jar 点击下载

配置MySQL CDC

cd config
cp v2.streaming.conf.template test.config
vim test.config

输入一下内容:

    env {# You can set SeaTunnel environment configuration hereexecution.parallelism = 2job.mode = "STREAMING"# 10秒检查一次,可以适当加大这个值checkpoint.interval = 10000#execution.checkpoint.interval = 10000#execution.checkpoint.data-uri = "hdfs://localhost:9000/checkpoint"}# 配置数据源source {MySQL-CDC {# 数据库账号username = "canal"password = "canal"# 源表,格式:数据库名.表名table-names = ["canalold.uc_user"]base-url = "jdbc:mysql://172.16.4.196:3306/canalold"}}# 配置目标库sink {jdbc {url = "jdbc:mysql://172.16.4.175:3306/canalnew"driver = "com.mysql.cj.jdbc.Driver"user = "canal"password = "canal"# 目标数据库名database = "canalnew"# 目标表名table = "uc_user"# 主键名称primary_keys = ["id"]}}

一张表一个配置

  • 启动集群
mkdir -p $SEATUNNEL_HOME/logs
nohup bin/seatunnel-cluster.sh 2>&1 &

提交任务:

nohup ./bin/seatunnel.sh --config ./config/test.config 2>&1 &

提交一次即可

前往logs目录查看是否提交成功

参考文档

集群部署:https://seatunnel.apache.org/docs/2.3.1/seatunnel-engine/deployment

常见问题

sql must not null

添加如下配置

database = "canalnew"
table = "uc_user"

如果不配置,必须配置query属性,即query属性和上面两个配置二选一,且上面两个配置优先级高

http://www.jmfq.cn/news/4776517.html

相关文章:

  • 做一个商城网站/进入百度搜索首页
  • 网站开发工具是啥/正规seo关键词排名哪家专业
  • asp 网站后台/全网整合营销推广
  • 与网络公司洽谈做网站需要注意什么/百度怎样发布作品
  • 网站建设时怎么附加数据库/腾讯云域名注册官网
  • wordpress子文件夹建站/指数基金
  • 网站建设 教程/社交网络推广方法
  • 在线html网页制作工具/seoul是什么意思中文
  • 做饮食网站怎么样/深圳优化网站方法
  • 音乐网站怎么做/黄山seo推广
  • 算命网站该怎样做/优化大师班级
  • 网站空间怎么进/抓取关键词的软件
  • 阿里云模板建站教程/百度产品大全首页
  • 视频网站建设方案/全国各城市疫情搜索高峰进度
  • 怎么弄一个公司网站/南京网站seo
  • wordpress建哪些网站吗/免费做推广的网站
  • 如何做网站app/合肥网络seo
  • 重庆市建设岗培中心网站/网络营销师资格证报名
  • 如何学习网站建设app/做个网页需要多少钱?
  • 一个公司网站备案/泰安seo网络公司
  • 下载app下载/宁波seo推广推荐公司
  • 找设计网站公司/线上推广费用
  • 江苏网站建设价格/seo排名诊断
  • wordpress 整合js/成都百度推广优化创意
  • 网站备案失败/网络热词大全
  • 公司做网站需要注意什么/百色seo快速排名
  • 深圳微信网站开发/windows优化大师自动安装
  • 芜湖网站建设优化/百度贴吧网页版登录入口
  • 望京 网站开发/各大网站提交入口
  • b2b外贸网站大全/江苏网站推广