从 OpenSearch 迁移至 Zilliz Cloud
本文档说明从 OpenSearch 迁移时,Zilliz Cloud 如何处理数据类型映射、Collection 命名规则及注意事项。
开始前
开始离线迁移前需满足:
OpenSearch 侧要求
| 要求项 | 详细说明 | 
|---|---|
| 网络访问 | 源集群必须可通过公网访问 | 
| 认证权限 | 需提供有效的集群 Endpoint、用户名及密码(具备必要权限) | 
| 向量字段要求 | 每个源索引必须包含至少一个 k-NN 向量字段 | 
| 数据可用性 | 源索引必须包含数据,空索引无法迁移 | 
Zilliz Cloud 侧要求
| 要求项 | 详细说明 | 
|---|---|
| 用户权限 | 需具备组织管理员或项目管理员角色 | 
| 目标集群容量 | 需预留足够 CU 容纳源数据(使用 CU 计算器预估容量) | 
| 网络连通性 | 如果有网络限制,请确保已将 Zilliz Cloud IP 加入白名单 | 
数据类型映射
下表总结了 OpenSearch 字段类型如何映射到 Zilliz Cloud 字段类型,并对各类型做了详细说明。
| OpenSearch 字段类型 | Zilliz Cloud 字段类型 | 描述 | 
|---|---|---|
| 主键(_id) | 主键 | OpenSearch 的 ID 字段将自动映射为 Zilliz Cloud 的主键字段。 | 
| 
 | OpenSearch 中的  向量维度保持不变。 | |
| Not supported | 暂不支持映射该字段。 | |
| 
 | Binary 数据在 Zilliz Cloud 中以字符串形式存储。 | |
| 
 | 
 | 直接映射。 | 
| 
 | 
 | 直接映射。 | 
| 
 | 
 | 直接映射。 | 
| 
 | 
 | 映射为  | 
| 
 | 
 | 直接映射。 | 
| 
 | 
 | 直接映射。 | 
| 
 | 
 | 直接映射。 | 
| 
 | 不支持 | 暂不支持映射该字段。 | 
| 
 | 不支持 | 暂不支持映射该字段。 | 
| 
 | 存储  | |
| 
 | 存储为字符串。 | |
| 
 | 存储为字符串。 | |
| 
 | 序列化为 JSON 格式。 | |
| 
 | JSON | 序列化为 JSON 格式。 | 
| 
 | JSON | 序列化为 JSON 格式。 | 
| 
 | JSON | 序列化为 JSON 格式。 | 
| 
 | VARCHAR | 存储为字符串。 | 
| 
 | 
 | 存储为字符串。 | 
| 
 | 
 | 映射到 Milvus 2.5 或更早版本中的 VARCHAR。 | 
| 
 | 
 | 存储为字符串。 | 
| 
 | 
 | 存储为 INT32。 | 
| 
 | 不支持 | 暂不支持映射该字段。 | 
| 
 | 存储为字符串。 | |
| 
 | 存储为字符串。 | |
| 
 | 存储为字符串。 | |
| 
 | 存储为字符串。 | |
| 不支持 | 暂不支持映射该字段。 | |
| 不支持 | 暂不支持映射该字段。 | |
| 不支持 | 暂不支持映射该字段。 | |
| 不支持 | 暂不支持映射该字段。 | 
OpenSearch 特殊处理规则
Collection 命名规则
OpenSearch 索引名称将按以下规则迁移至 Zilliz Cloud:
| 场景 | 影响 | 解决方案 | 
|---|---|---|
| 默认命名 | Collection 名称与源索引名称完全一致 | 保留原始名称 | 
| 特殊字符 | 含连字符(-)或点号(.)的索引名称将导致迁移任务提交失败 | 手动重命名目标 Collection(使用下划线等合法字符) | 
| 名称冲突 | 目标 Database 存在同名 Collection 时无法提交迁移任务 | 删除现有 Collection / 选择其他目标 Database / 迁移配置时重命名 Collection | 
迁移注意事项
从 OpenSearch 迁移时需注意以下事项:
| 限制项 | 影响 | 替代方案 | 
|---|---|---|
| 动态字段转固定字段 | 无法将现有动态字段转换为固定类型 | 字段保持原始动态特性 | 
| 迁移过程中添加新字段 | 仅迁移 Elasticsearch 已有字段 | 无法在迁移时新增字段 | 
| 稀疏向量迁移 | 当前版本不支持迁移稀疏向量 | 考虑使用稠密向量替代方案,或联系支持团队了解路线图 |