简介
CloudCanal 近期增强了数据汇聚防重能力,消除各个来源 数据表名冲突、主键/唯一键约束冲突 的可能性。
这个增强具体特性包括:
- 常用虚拟列添加
- 指定虚拟列为对端表主键
- 对端表名分级元数据拼接
- 可视化操作,无需写自定义代码
本文简要介绍上述特性,并使用 MySQL -> StarRocks 作为示例进行能力演示。
技术点
多种虚拟列
为了应对不同场景,不同数据源,CloudCanal 提供了以下虚拟列生成能力,如下表。
同时也支持 单表设置多个虚拟列,针对特定表设置,批量设置。
虚拟列种类 说明 有效的操作 指定具体值 可指定特定的数字、字符串生成新列,写入到对端 INSERT 数据迁移或同步时间 以数据到达 CloudCanal 的时间生成新列,写入对端 INSERT 源端实例ID_SCHEMA_表_主键值 按照源端数据源 实例ID,Schema,表 和 主键值 做拼接生成新列,写入对端 INSERT,UPDATE,DELETE 源端实例ID_DB_SCHEMA_表_主键值 按照源端数据源 实例ID,Catalog,Schema,表 和 主键值 做拼接生成新列,写入对端 INSERT,UPDATE,DELETE 源端实例DB_SCHEMA_表_主键值 按照源端数据源 Catalog,Schema,表 和 主键值 做拼接生成新列,写入对端 INSERT,UPDATE,DELETE 源端实例SCHEMA_表_主键值 按照源端数据源 Schema,表 和 主键值 做拼接生成新列,写入对端 INSERT,UPDATE,DELETE 源端实例表_主键值 按照源端数据源 表 和 主键值 做拼接生成新列,写入对端 INSERT,UPDATE,DELETE 指定虚拟列为对端主键(唯一键)
多来源数据汇聚到同一张表,如果存在主键或唯一约束,往往会形成冲突,比较典型的例子如来自各地的 MySQL 数据自带自增主键,汇聚到对端主键即冲突。
为了解决这个问题,我们利用既有的 设定对端主键能力,将其扩展到虚拟列,通过将类似 源端实例ID_SCHEMA_表_主键值 设置成对端主键达成主键或唯一键约束成立。
此能力可针对特定表或批量进行设置。
对端表名拼接
业务除了汇聚到同一张表的需求,也存在保持源端独立表的需求,这个时候需要解决表名冲突问题。
CloudCanal 针对不同数据源,提供以下几种表名拼接规则,在结构迁移时重命名,并且数据迁移和同步支持此类元数据映射。
表名映射规则 说明 按 SCHEMA_TABLE 拼接(元数据镜像) 按照源端数据源 Schema,表 拼接作为对端表名 按 SCHEMA_TABLE 拼接(元数据转小写) 按照源端数据源 Schema,表 拼接并转为 小写 作为对端表名 按 SCHEMA_TABLE 拼接(元数据转大写) 按照源端数据源 Schema,表 拼接并转为 大写 作为对端表名 按 DB_SCHEMA_TABLE 拼接(元数据镜像) 按照源端数据源 Catalog,Schema,表 拼接作为对端表名 按 DB_SCHEMA_TABLE 拼接(元数据转小写) 按照源端数据源 Catalog,Schema,表 拼接并转为 小写 作为对端表名 按 DB_SCHEMA_TABLE 拼接(元数据转大写) 按照源端数据源 Catalog,Schema,表 拼接并转为 大写 作为对端表名 支持的链路
此次增强,因为测试时间紧张,我们只开了一批链路,如下列表所示,这些链路均支持上述特性
- MySQL -> MySQL, MySQL -> StarRocks, MySQL -> Doris, MySQL -> SelectDB, MySQL -> ClickHouse, MySQL -> PostgreSQL, MySQL -> ORACLE
- ORACLE -> StarRocks ,ORACLE -> MySQL
- PostgreSQL -> MySQL
操作示例
环境准备
-
根据文档安装 CloudCanal Docker 版
-
添加 MySQL 数据库和 阿里云 EMR for StarRocks
任务创建
-
选择数据源信息略,点击下一步
-
选择任务规格、配置略,点击下一步
-
选择库表,点击库表映射,选择 按 SCHEMA_TABLE 拼接(元数据镜像),可看到对端表名按规则拼接
-
点击下一步
-
选择列页面
-
批量操作 > 批量设置虚拟列
-
批量操作 > 批量设置对端主键,此例选择 vir_instid_sche_tab_pk 作为对端主键
-
点击下一步
-
确认任务创建
-
结构迁移,全量迁移,增量同步正常运行
功能验证
查看全量迁移数据
-
使用 CloudDM 查询对端表数据,结构正确(主键),虚拟列数据按规则生成
-
源端插入和更新数据,对端虚拟列数据按规则插入或更新(pk字段更新,暂未支持)
-
源端删除数据,对端则删除对应数据
总结
本文主要介绍 CloudCanal 数据防重能力,降低数据汇聚场景各个来源数据表名冲突、主键/唯一键约束冲突的概率,从而让用户更加便捷地落地在线数据应用。
-
-
-
猜你喜欢
- 17天前(鄂尔多斯航空公司客服电话)架起“北方之路” ,中国联合航空带您飞向鄂尔多斯重回1倍速
- 17天前(中旅酒店 维景)中旅酒店首次AI数字人直播亮相南京维景
- 17天前(瑞虎7plus2021款)重塑10万级SUV价值标杆,全新一代瑞虎7PLUS冠军版给你惊喜
- 17天前(马尔代夫华尔道夫酒店多少钱)Chef Zhao就任马尔代夫伊挞富士岛华尔道夫酒店Li Long中餐厅新主厨
- 17天前(澳涞山庄见证北欧零碳到中国实践,世界十佳环境保护城市榜单发布)澳涞山庄见证北欧零碳到中国实践,世界十佳环境保护城市榜单发布
- 17天前(希尔顿集团2021年筹建的酒店)希尔顿集团两大重点项目亮相第四届上海旅游投资促进大会
- 17天前(携程租车加盟合作)携程租车加盟优势全解析:开启旅游出行市场新篇章
- 17天前(冬日生活还没安排?上抖音一键打包北方花式过冬精彩)冬日生活还没安排?上抖音一键打包北方花式过冬精彩
- 17天前(锦江 iu)锦江荟APP原生鸿蒙版正式上线打造全场景旅行服务新体验
- 17天前(阿斯塔纳航空属于哪个联盟)阿斯塔纳航空荣获Skytrax世界航空公司大奖,将继续助力中哈交流往来
网友评论
- 搜索
- 最新文章
- (2020广州车展哈弗)你的猛龙 独一无二 哈弗猛龙广州车展闪耀登场
- (哈弗新能源suv2019款)智能科技颠覆出行体验 哈弗重塑新能源越野SUV价值认知
- (2021款全新哈弗h5自动四驱报价)新哈弗H5再赴保障之旅,无惧冰雪护航哈弗全民电四驱挑战赛
- (海南航空现况怎样)用一场直播找到市场扩张新渠道,海南航空做对了什么?
- (visa jcb 日本)优惠面面俱到 JCB信用卡邀您畅玩日本冰雪季
- (第三届“堡里有年味·回村过大年”民俗花灯会活动)第三届“堡里有年味·回村过大年”民俗花灯会活动
- (展示非遗魅力 长安启源助力铜梁龙舞出征)展示非遗魅力 长安启源助力铜梁龙舞出征
- (阿斯塔纳航空公司)阿斯塔纳航空机队飞机数量增至50架
- (北京香港航班动态查询)香港快运航空北京大兴新航线今日首航
- (我在港航“呵护”飞机 每一次安全着陆就是最好的荣誉)我在港航“呵护”飞机 每一次安全着陆就是最好的荣誉
- 热门文章