云搜索服务迁移指南

容器与中间件中间件技术服务知识库
场景介绍

在云搜索迁移场景中,您可以通过 Logstash、reindex 和 TOS 快照等多种方式完成数据迁移,本文介绍各迁移场景对应的迁移方案,使用限制和使用场景。

云搜索迁移方案选择

Logstash

适用场景

  • 对实时性要求不高。
  • 对指定查询结果集进行迁移。
  • 迁移时需对数据进行处理。
  • 支持不兼容的 ES 集群版本迁移,例如 2.x 迁移到 6.x/7.x,5.x 到 7.x。

使用限制

  • 源 Elasticsearch、Logstash 和 目标 云搜索实例需要保证网络连通性。
  • 源 Elasticsearch、Logstash 和目标实例版本需满足兼容性要求。
  • 如果需要同步增量数据,需确保源端数据的 ID 和目标端 ID一致,并且需配置 schedule 定时任务。
  • 如索引 settings 或 mappings 有不兼容配置,需手动处理。

reindex

适用场景

  • 源端数据量较小,且对迁移速度要求不高的场景。
  • 仅对查询结果进行迁移的场景。
  • 不想使用、依赖外部工具可以考虑 reindex API。

使用限制

  • 需要全量重启目标集群修改配置:reindex.remote.whitelist。
  • 源集群、目标集群网络互通。
  • 云搜索 V2 版本无法使用 reindex API。

TOS 快照

适用场景

  • 源端数据量较大,如 TB,PB 级别,速度最快。
  • 适用于同账号或跨账号云搜索服务间迁移数据。

使用限制

  • 源集群,目标集群需要与 TOS 网络联通,保证使用的 IAM 账号具有访问,写入 TOS 存储桶的权限。
  • 无法迁移增量数据。

elasticsearch-dump

适用场景

  • 数据量较小,索引数量不多的迁移场景
  • 源集群,目标集群与安装 elasticsearch-dump 工具的云服务器网络需要互通。
参考文档

如果您有其他问题,欢迎您联系火山引擎技术支持服务

31
0
0
0
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论