从 OpenSearch 迁移至 Zilliz Cloud
本文档说明从 OpenSearch 迁移时,Zilliz Cloud 如何处理数据类型映射、Collection 命名规则及注意事项。
开始前
开始离线迁移前需满足:
OpenSearch 侧要求
要求项 | 详细说明 |
---|---|
网络访问 | 源集群必须可通过公网访问 |
认证权限 | 需提供有效的集群 Endpoint、用户名及密码(具备必要权限) |
向量字段要求 | 每个源索引必须包含至少一个 k-NN 向量字段 |
数据可用性 | 源索引必须包含数据,空索引无法迁移 |
Zilliz Cloud 侧要求
要求项 | 详细说明 |
---|---|
用户权限 | 需具备组织管理员或项目管理员角色 |
目标集群容量 | 需预留足够 CU 容纳源数据(使用 CU 计算器预估容量) |
网络连通性 | 如果有网络限制,请确保已将 Zilliz Cloud IP 加入白名单 |
数据类型映射
下表总结了 OpenSearch 字段类型如何映射到 Zilliz Cloud 字段类型,并对各类型做了详细说明。
OpenSearch 字段类型 | Zilliz Cloud 字段类型 | 描述 |
---|---|---|
主键(_id) | 主键 | OpenSearch 的 ID 字段将自动映射为 Zilliz Cloud 的主键字段。 |
| OpenSearch 中的 向量维度保持不变。 | |
Not supported | 暂不支持映射该字段。 | |
| Binary 数据在 Zilliz Cloud 中以字符串形式存储。 | |
|
| 直接映射。 |
|
| 直接映射。 |
|
| 直接映射。 |
|
| 映射为 |
|
| 直接映射。 |
|
| 直接映射。 |
|
| 直接映射。 |
| 不支持 | 暂不支持映射该字段。 |
| 不支持 | 暂不支持映射该字段。 |
| 存储 | |
| 存储为字符串。 | |
| 存储为字符串。 | |
| 序列化为 JSON 格式。 | |
| JSON | 序列化为 JSON 格式。 |
| JSON | 序列化为 JSON 格式。 |
| JSON | 序列化为 JSON 格式。 |
| VARCHAR | 存储为字符串。 |
|
| 存储为字符串。 |
|
| 映射到 Milvus 2.5 或更早版本中的 VARCHAR。 |
|
| 存储为字符串。 |
|
| 存储为 INT32。 |
| 不支持 | 暂不支持映射该字段。 |
| 存储为字符串。 | |
| 存储为字符串。 | |
| 存储为字符串。 | |
| 存储为字符串。 | |
不支持 | 暂不支持映射该字段。 | |
不支持 | 暂不支持映射该字段。 | |
不支持 | 暂不支持映射该字段。 | |
不支持 | 暂不支持映射该字段。 |
OpenSearch 特殊处理规则
Collection 命名规则
OpenSearch 索引名称将按以下规则迁移至 Zilliz Cloud:
场景 | 影响 | 解决方案 |
---|---|---|
默认命名 | Collection 名称与源索引名称完全一致 | 保留原始名称 |
特殊字符 | 含连字符(-)或点号(.)的索引名称将导致迁移任务提交失败 | 手动重命名目标 Collection(使用下划线等合法字符) |
名称冲突 | 目标 Database 存在同名 Collection 时无法提交迁移任务 | 删除现有 Collection / 选择其他目标 Database / 迁移配置时重命名 Collection |
迁移注意事项
从 OpenSearch 迁移时需注意以下事项:
限制项 | 影响 | 替代方案 |
---|---|---|
动态字段转固定字段 | 无法将现有动态字段转换为固定类型 | 字段保持原始动态特性 |
迁移过程中添加新字段 | 仅迁移 Elasticsearch 已有字段 | 无法在迁移时新增字段 |
稀疏向量迁移 | 当前版本不支持迁移稀疏向量 | 考虑使用稠密向量替代方案,或联系支持团队了解路线图 |