文本数据
您可以通过 Web 控制台或 RESTful API 创建、运行和管理 Pipelines。Web 控制台操作更简单直观,但 RESTful API 可提供更多灵活性。
本文将介绍如何创建文本 Pipeline、进行语义搜索并删除 Pipeline。
前提条件与限制
-
请确保您创建部署在阿里云(杭州)的集群。
-
同一项目下,您可最多创建 100 个同一类型的 Pipelines。更多详情,请参考使用限制。
摄取文本数据
摄取文本数据包含两个步骤:创建 Ingestion Pipeline 和运行 Ingestion Pipeline。
创建文本 Ingestion Pipeline
- Cloud Console
- cURL
-
打开项目。
-
点击左侧导航栏中的 Pipelines。 选中概览标签页,并切换到 Pipelines。点击 + Pipeline。
-
选择需要创建的 Pipeline 类型。点击 Ingestion Pipeline。
-
配置 Ingestion Pipeline。
参数
说明
目标集群
自动创建 Collection 所属的集群。目前仅支持部署在阿里云(杭州)的集群。
Collection 名称
自动创建的 Collection 的名称。
Pipeline 名称
新创建的 Ingestion Pipeline 的名称。名称中只可包含小写字母、数字和下划线。
描述 (可选)
对新创建的 Ingestion Pipeline 的描述。
-
添加 Function。1 个 Ingestion pipeline 中只可添加 1 个 INDEX Function。
-
输入 Function 名称。
-
选择 INDEX_TEXT Function。该 Function 可以将输入文本转换为 Embedding 向量。
-
选择用于生成向量的 Embedding 模型。根据所选的文档语言,您可以选择不同的 Embedding 模型。目前 Zilliz Cloud Pipelines 共提供两种 Embedding 模型:英语——zilliz/bge-base-en-v1.5,中文——zilliz/bge-base-zh-v1.5。
Embedding 模型
说明
zilliz/bge-base-en-v1.5
智源研究院(BAAI)发布的开源 Embedding 向量模型。该模型与向量数据库共同托管于 Zilliz Cloud 上,具备出色的性能,可大幅降低延时。
zilliz/bge-base-zh-v1.5
智源研究院(BAAI)发布的开源 Embedding 向量模型。该模型与向量数据库共同托管于 Zilliz Cloud 上,具备出色的性能,可大幅降低延时。
-
点击添加。
-
-
(可选) 添加 PRESERVE Function。PRESERVE Function 在 Collection 中添加标量字段,用于保留文档元数据。
📘说明每个 Ingestion Pipeline 中最多可添加 50 个 PRESERVE Function。
-
点击 + Function。
-
输入 Function 名称。
-
配置输入字段名称和数据类型。支持的数据字段类型包括 Bool、Int8、Int16、Int32、Int64、Float、Double 和 VarChar。
📘说明目前,输出字段名称必须与输入字段名称保持一致。在运行 Ingestion Pipeline 时,您将使用到输入字段名称。而输出字段名称用于自动生成的 Collection Schema 中作为保留的标量字段名称。
字段类型为 VarChar 时,字符串最大长度为 4,000 个字符,且只可包含数字、字母。
在标量字段中存储日期时,我们推荐使用 Int16 的数据类型。存储时间时,我们推荐使用 Int32 的数据类型。
-
点击添加。
-
-
点击创建 Ingestion Pipeline。
-
继续创建 Search pipeline 和 Deletion pipeline。创建的 Search 和 Deletion Pipeline 可适应配套刚才创建的Ingestion Pipeline。
📘说明自动创建的 Search Pipeline 默认关闭 Reranker 功能,如需使用 Reranker,请手动创建一个新的 Search Pipeline。
以下示例代码创建了 1 个名称为 my_text_ingestion_pipeline
的 Ingestion Pipeline,并添加了 1 个 INDEX_TEXT Function 和 1 个 PRESERVE Function。
curl --request POST \
--header "Content-Type: application/json" \
--header "Authorization: Bearer ${YOUR_API_KEY}" \
--url "https://controller.api.{cloud-region}.cloud.zilliz.com.cn/v1/pipelines" \
-d '{
"name": "my_text_ingestion_pipeline",
"clusterId": "inxx-xxxxxxxxxxxxxxx",
"projectId": "proj-xxxx",
"collectionName": "my_collection",
"description": "A pipeline that generates text embeddings and stores additional fields.",
"type": "INGESTION",
"functions": [
{
"name": "index_my_text",
"action": "INDEX_TEXT",
"language": "ENGLISH",
"embedding": "zilliz/bge-base-en-v1.5"
},
{
"name": "keep_text_info",
"action": "PRESERVE",
"inputField": "source",
"outputField": "source",
"fieldType": "VarChar"
}
]
}'
以下为参数说明:
-
YOUR_API_KEY
: 验证 API 请求的鉴权信息。了解如何查看 API 密钥。 -
cloud-region
: 集群所在云服务地域的 ID。目前仅支持ali-cn-hangzhou
。 -
clusterId
: 创建 Pipeline 所属的集群 ID。目前,仅支持部署在阿里云(杭州)的集群。了解如何获取集群 ID。 -
projectId
: 创建 Pipeline 所属的项目 ID。了解如何获取项目 ID。 -
collectionName
: 与 Pipeline 同步自动创建的 Collection 名称。或者,您也可以指定一个已有的 Collection。 -
name
: 创建的 Pipeline 名称。Pipeline 名称应该在 3-64 个字符内,且只可包含数字、字母和下划线。 -
description
(可选): 创建的 Pipeline 描述。 -
type
: 创建的 Pipeline 类型。目前,可创建的 Pipeline 类型包括INGESTION
、SEARCH
和DELETION
。 -
functions
: Pipeline 中添加的 Function。1 个 Ingestion pipeline 中只可添加 1 个 INDEX Function 和至多 50 个 PRESERVE Function。-
name
: Function 名称。Function 名称应该在 3-64 个字符内,且只可包含数字、字母和下划线。 -
action
: Function 类型。您可以在 Ingestion Pipeline 中添加的 Function 类型包括:INDEX_DOC
、INDEX_TEXT
、INDEX_IMAGE
和PRESERVE
。 -
language
: 文档语言。可选择的语言包括ENGLISH
(英语) 和CHINESE
(中文)。(仅INDEX_TEXT
和INDEX_DOC
Function 中包含此参数。) -
embedding
: 用于生成向量的 Embedding 模型。 (仅INDEX
Function 中包含此参数。)Embedding 模型
说明
zilliz/bge-base-en-v1.5
智源研究院(BAAI)发布的开源 Embedding 向量模型。该模型与向量数据库共同托管于 Zilliz Cloud 上,具备出色的性能,可大幅降低延时。
zilliz/bge-base-zh-v1.5
智源研究院(BAAI)发布的开源 Embedding 向量模型。该模型与向量数据库共同托管于 Zilliz Cloud 上,具备出色的性能,可大幅降低延时。
-
-
inputField
: 输入字段名称。 您可以自定义输入字段名称,但需要与outputField
保持一致。(仅PRESERVE
Function 中包含此参数。) -
outputField
: 输出字段名称。该字段将的值将用于构成 Collection Schema。outputField
字段值应该与inputField
字段值保持一致。 (仅PRESERVE
Function 中包含此参数。) -
fieldType
: 输入和输出字段的字段类型。可选的值包括:Bool
、Int8
、Int16
、Int32
、Int64
、Float
、Double
和VarChar
。 (仅PRESERVE
Function 中包含此参数。)📘说明在标量字段中存储日期时,我们推荐使用 Int16 的数据类型。存储时间时,我们推荐使用 Int32 的数据类型。
对于
VarChar
字段类型而言,字段数据的最大长度max_length
不得超过 4,000。
如果请求返回以下类似内容,则表示 Ingestion Pipeline 创建成功:
{
"code": 200,
"data": {
"pipelineId": "pipe-xxx",
"name": "my_text_ingestion_pipeline",
"type": "INGESTION",
"createTimestamp": 1721187300000,
"description": "A pipeline that generates text embeddings and stores additional fields.",
"status": "SERVING",
"totalUsage": {
"embedding": 0
},
"functions": [
{
"name": "index_my_text",
"action": "INDEX_TEXT",
"inputFields": ["text_list"],
"language": "ENGLISH",
"embedding": "zilliz/bge-base-en-v1.5"
},
{
"name": "keep_text_info",
"action": "PRESERVE",
"inputField": "source",
"outputField": "source",
"fieldType": "VarChar"
}
],
"clusterId": "inxx-xxxx",
"collectionName": "my_collection"
}
}
总用量 totalUsage
非实时更新,数据统计可能会有几小时延迟。
Ingestion Pipeline 创建成功后,Zilliz Cloud 将进行重名检查。如果集群中没有该名称的 Collection,将自动创建名称为 my_collection
的新 Collection。如果已存在同名的 Collection,Zilliz Cloud Pipelines 会继续检查该已有 Collection 的 Schema 是否与 Pipeline 中定义的一致。
该 Collection 中包含 4 个字段:3 个 INDEX_TEXT function 的输出字段和 1 个 PRESERVE function 的输出字段。Collection Schema 如下所示:
id | text | embedding | source |
---|
运行文本 Ingestion Pipeline
- Cloud Console
- cURL
-
点击 Ingestion Pipeline 右侧的 "▶︎" 按钮。 或者您可以点击 Playground 选项卡。
-
在
text_list
字段中输入需要摄取的文本或者文本列表。如您添加了 PRESERVE Function,请在该 Function 定义的字段中输入需要保留的元数据信息。点击运行。 -
查看运行结果。
以下示例代码用于运行 Ingestion pipeline my_text_ingestion_pipeline
。source
是需要保留的元数据字段。
curl --request POST \
--header "Content-Type: application/json" \
--header "Authorization: Bearer ${YOUR_API_KEY}" \
--url "https://controller.api.{cloud-region}.cloud.zilliz.com.cn/v1/pipelines/${YOUR_PIPELINE_ID}/run" \
-d '{
"data": {
"text_list": [
"Zilliz Cloud is a fully managed vector database and data services, empowering you to unlock the full potential of unstructured data for your AI applications.",
"It can store, index, and manage massive embedding vectors generated by deep neural networks and other machine learning (ML) models."
],
"source": "Zilliz official website"
}
}'
以下为参数说明:
-
YOUR_API_KEY
: 验证 API 请求的鉴权信息。了解如何查看 API 密钥。 -
cloud-region
: 集群的云服务地域。目前仅支持ali-cn-hangzhou
。 -
text_list
: 需要摄取的文本或文本列表。 -
source
(可选): 需要保留的元数据字段。字段名称需要与创建 Ingestion Pipeline 并添加 PRESERVE Function 时定义的输入字段名称保持一致。字段数据类型也应与预先定义的保持一致。
请求返回以下类似内容:
{
"code": 200,
"data": {
"num_entities": 2,
"usage": {
"embedding": 63
},
"ids": [
450524927755105948,
450524927755105949
]
}
}
搜索文本数据
搜索数据前,请先创建并运行 Search Pipeline。与 Ingestion 和 Deletion Pipelines 不同,Search Pipeline 创建时是在 Function 级别定义集群和 Collection,而非在 Pipeline 层级。这是因为 Zilliz Cloud 支持同时从多个 Collection 搜索数据。
创建文本 Search Pipeline
- Cloud Console
- cURL
-
打开项目。
-
点击左侧导航栏中的 Pipelines。 选中概览标签页,并切换到 Pipelines。点击 + Pipeline。
-
选择需要创建的 Pipeline 类型。点击 Search Pipeline 一栏中的 + Pipeline 按钮。
-
配置 Search Pipeline。
参数
说明
Pipeline 名称
新创建的 Ingestion Pipeline 的名称。名称中只可包含小写字母、数字和下划线。
描述 (可选)
对新创建的 Ingestion Pipeline 的描述。
-
点击 + Function 添加 Function。 1 个 Search pipeline 中只可添加 1 个 Function。
-
输入函数名称。
-
选择目标集群和目标 Collection。目标集群必须为部署在阿里云(杭州)的活跃集群。目标 Collection 必须为创建 Ingestion pipeline 时自动创建的 Collection,否则创建的 Search Pipeline 将不兼容。
-
Function 类型选择 SEARCH_TEXT。SEARCH_TEXT Function 可以将输入的查询文本转换为 Embedding 向量,并检索出与之最相关的 Top-K 个文本 Entity。
-
(可选) 如需对输出结果根据相关性进行重新排序、提高搜索结果质量,请开启 Reranker。请注意,开启 Reranker 会增加使用成本和搜索延时。默认情况下,Reranker 功能关闭。开启后,您可以选择 Reranker 模型。目前仅支持 zilliz/bge-reranker-base 模型。
Reranker 模型
描述
zilliz/bge-reranker-base
智源研究院(BAAI)发布的开源重新排序(Reranker)模型。该模型采用交叉编码器架构,并托管于 Zilliz Cloud 上。
-
点击添加。
-
-
点击创建 Search Pipeline。
以下示例代码创建了 1 个名称为 my_text_search_pipeline
的 Search Pipeline,并添加了 1 个 SEARCH_TEXT Function。
curl --request POST \
--header "Content-Type: application/json" \
--header "Authorization: Bearer ${YOUR_API_KEY}" \
--url "https://controller.api.{cloud-region}.cloud.zilliz.com.cn/v1/pipelines" \
-d '{
"projectId": "proj-xxxx",
"name": "my_text_search_pipeline",
"description": "A pipeline that receives text and search for semantically similar texts",
"type": "SEARCH",
"functions": [
{
"name": "search_text",
"action": "SEARCH_TEXT",
"clusterId": "inxx-xxxxxxxxxxxxxxx",
"collectionName": "my_collection",
"embedding": "zilliz/bge-base-en-v1.5",
"reranker": "zilliz/bge-reranker-base"
}
]
}'
以下为参数说明:
-
YOUR_API_KEY
: 验证 API 请求的鉴权信息。了解如何查看 API 密钥。 -
cloud-region
: 集群所在云服务地域的 ID。目前仅支持ali-cn-hangzhou
。 -
projectId
: 创建 Pipeline 所属的项目 ID。了解如何获取项目 ID。 -
name
: 创建的 Pipeline 名称。Pipeline 名称应该在 3-64 个字符内,且只可包含数字、字母和下划线。 -
description
(可选):创建的 Pipeline 描述。 -
type
: 创建的 Pipeline 类型。目前,可创建的 Pipeline 类型包括INGESTION
、SEARCH
和DELETION
。 -
functions
: Pipeline 中添加的 Function。1 个 Search Pipeline 中仅可添加 1 个 Function。-
name
: Function 名称。Function 名称应该在 3-64 个字符内,且只可包含数字、字母和下划线。 -
action
: Function 类型。支持的类型包括:SEARCH_DOC_CHUNK
、SEARCH_TEXT
、SEARCH_IMAGE_BY_IMAGE
、SEARCH_IMAGE_BY_TEXT
。 -
inputField
: 输入字段名称。您可以自由配置该字段的值。但是在运行 Pipeline 时,您需要使用现在定义的输入字段名称。 -
clusterId
: 创建 Pipeline 所属的集群 ID。目前,仅支持部署在阿里云(杭州)的集群。了解如何获取集群 ID。 -
collectionName
: 创建 Pipeline 所属的 Collection 名称。 -
embedding
:向量搜索时使用的 Embedding 模型。该模型需要与所选 Collection 中的 Embedding 模型保持一致。 -
reranker
(可选): 使用 Reranker 对输出结果进行重新排序,提高搜索结果质量。目前,仅支持zilliz/bge-reranker-base
作为 Reranker 模型。
-
如果请求返回以下类似内容,则表示 Search Pipeline 创建成功:
{
"code": 200,
"data": {
"pipelineId": "pipe-xxxx",
"name": "my_text_search_pipeline",
"type": "SEARCH",
"createTimestamp": 1721187655000,
"description": "A pipeline that receives text and search for semantically similar texts",
"status": "SERVING",
"totalUsage": {
"embedding": 0,
"rerank": 0
},
"functions": [
{
"name": "search_text",
"action": "SEARCH_TEXT",
"inputFields": [
"query_text"
],
"clusterId": "inxx-xxxx",
"collectionName": "my_collection",
"reranker": "zilliz/bge-reranker-base",
"embedding": "zilliz/bge-base-en-v1.5"
}
]
}
}
总用量非实时更新,数据统计可能会有几小时延迟。
运行文本 Search Pipeline
- Cloud Console
- cURL
-
点击 Search Pipeline 右侧的 "▶︎" 按钮。 或者您可以点击 Playground 选项卡。
-
输入查询文本。点击运行。
-
查看运行结果。
以下示例代码用于运行 Search pipeline my_text_search_pipeline
。查询文本为“What is Zilliz Cloud?”(什么是 Zilliz Cloud?)。
curl --request POST \
--header "Content-Type: application/json" \
--header "Authorization: Bearer ${YOUR_API_KEY}" \
--url "https://controller.api.{cloud-region}.cloud.zilliz.com.cn/v1/pipelines/${YOUR_PIPELINE_ID}/run" \
-d '{
"data": {
"query_text": "What is Zilliz Cloud?"
},
"params":{
"limit": 1,
"offset": 0,
"outputFields": [],
"filter": "id >= 0",
}
}'
以下为参数说明:
-
YOUR_API_KEY
: 验证 API 请求的鉴权信息。了解如何查看 API 密钥。 -
cloud-region
: 集群的云服务地域。目前仅支持ali-cn-hangzhou
。 -
query_text
: 语义搜索的查询文本。 -
params
: 搜索相关参数。-
limit
: 返回的 Entity 数量。该参数值为 1-500 之间的整数。limit
和offset
参数值总和应小于 1024。 -
offset
: 在搜索结果中跳过的 Entity 数量。最大值为 1024。limit
和offset
参数值总和应小于 1024。 -
outputFields
: 在搜索结果中一同返回的输出字段。id
、distance
和chunk_text
为默认输出字段。 -
filter
: 搜索时的过滤条件。
-
请求返回以下类似内容:
{
"code": 200,
"data": {
"result": [
{
"id": 450524927755105948,
"distance": 0.9997715353965759,
"text": "Zilliz Cloud is a fully managed vector database and data services, empowering you to unlock the full potential of unstructured data for your AI applications."
}
],
"usage": {
"embedding": 17,
"rerank": 43
}
}
}
删除文本数据
如需删除数据,请先创建并运行 Deletion Pipeline。
创建文本 Deletion Pipeline
- Cloud Console
- cURL
-
打开项目。
-
点击左侧导航栏中的 Pipelines。 选中概览标签页,并切换到 Pipelines。点击 + Pipeline。
-
选择需要创建的 Pipeline 类型。点击 Deletion Pipeline 一栏中的 + Pipeline 按钮。
-
配置 Deletion Pipeline。
参数
说明
Pipeline 名称
新创建的 Deleltion Pipeline 名称。名称中只可包含小写字母、数字和下划线。
描述 (可选)
对新创建的 Deletion Pipeline 的描述。
-
点击 + Function 添加 Function。您只可添加 1 个 Function。
-
输入 Function名称。
-
从 PURGE_TEXT_INDEX 或 PURGE_BY_EXPRESSION 中选择 1 个作为 Function 类型。 PURGE_TEXT_INDEX Function 可以删除指定 id 的所有文本 Entity。PURGE_BY_EXPRESSION Function 可以删除符合指定过滤条件的所有文本 Entity。
-
点击添加。
-
-
点击创建 Deletion Pipeline。
以下示例代码创建了 1 个名称为 my_text_deletion_pipeline
的 Deletion Pipeline,并添加了 1 个 PURGE_BY_EXPRESSION Function。
curl --request POST \
--header "Content-Type: application/json" \
--header "Authorization: Bearer ${YOUR_API_KEY}" \
--url "https://controller.api.{cloud-region}.cloud.zilliz.com.cn/v1/pipelines" \
-d '{
"projectId": "proj-xxxx",
"name": "my_text_deletion_pipeline",
"description": "A pipeline that deletes entities by expression",
"type": "DELETION",
"functions": [
{
"name": "purge_data_by_expression",
"action": "PURGE_BY_EXPRESSION"
}
],
"clusterId": "inxx-xxxxxxxxxxxxxxx",
"collectionName": "my_collection"
}'
以下为参数说明:
-
YOUR_API_KEY
: 验证 API 请求的鉴权信息。了解如何查看 API 密钥。 -
cloud-region
: 集群所在云服务地域的 ID。目前仅支持ali-cn-hangzhou
。 -
projectId
: 创建 Pipeline 所属的项目 ID。了解如何获取项目 ID。 -
name
: 创建的 Pipeline 名称。Pipeline 名称应该在 3-64 个字符内,且只可包含数字、字母和下划线。 -
description
(可选): 创建的 Pipeline 描述。 -
type
: 创建的 Pipeline 类型。目前,可创建的 Pipeline 类型包括INGESTION
、SEARCH
和DELETION
。 -
functions:
Pipeline 中添加的 Function。1 个 Deletion Pipeline 中仅可添加 1 个 Function。-
name
: Function 名称。Function 名称应该在 3-64 个字符内,且只可包含数字、字母和下划线。 -
action
: Function 类型。可选择的 Function 类型包含:PURGE_DOC_INDEX
、PURGE_TEXT_INDEX
、PURGE_BY_EXPRESSION
和PURGE_IMAGE_INDEX
。
-
-
clusterId
: 创建 Pipeline 所属的集群 ID。目前,仅支持部署在阿里云(杭州)的集群。了解如何获取集群 ID。 -
collectionName
: 创建 Pipeline 所属的 Collection 名称。
如果请求返回以下类似内容,则表示 Deletion Pipeline 创建成功:
{
"code": 200,
"data": {
"pipelineId": "pipe-xxxx",
"name": "my_text_deletion_pipeline",
"type": "DELETION",
"createTimestamp": 1721187655000,
"description": "A pipeline that deletes entities by expression",
"status": "SERVING",
"functions": [
{
"action": "PURGE_BY_EXPRESSION",
"name": "purge_data_by_expression",
"inputFields": ["expression"]
}
],
"clusterId": "in03-***************",
"collectionName": "my_collection"
}
}
运行文本 Deletion Pipeline
- Cloud Console
- cURL
-
点击 Deletion Pipeline 右侧的 "▶︎" 按钮。或者您可以点击 Playground 选项卡。
-
输入过滤表达式,点击运行。
-
查看运行结果。
以下示例代码用于运行 Deletion Pipeline my_text_deletion_pipeline
。
curl --request POST \
--header "Content-Type: application/json" \
--header "Authorization: Bearer ${YOUR_API_KEY}" \
--url "https://controller.api.{cloud-region}.cloud.zilliz.com.cn/v1/pipelines/${YOUR_PIPELINE_ID}/run" \
-d '{
"data": {
"expression": "id in [1, 2, 3]"
}
}'
以下为参数说明:
-
YOUR_API_KEY
: 验证 API 请求的鉴权信息。了解如何查看 API 密钥。 -
cloud-region
: 集群的云服务地域。目前仅支持ali-cn-hangzhou
。 -
expression
: 布尔表达式,用于过滤出需要删除的所有 Entity。更多关于表达式详情,请参考过滤表达式。
请求返回以下类似内容:
{
"code": 200,
"data": {
"num_deleted_entities": 3
}
}
管理 Pipeline
以下操作可用于管理此前创建的 Pipeline。
查看 Pipeline
- Cloud Console
- cURL
点击左侧导航栏中的 Pipelines。选中 Pipelines 选项卡。您可以查看所有已创建的 Pipelines。
点击特定 Pipeline 名称,还可以查看其详情,包括基本信息、总用量、Functions、关联的 Connectors 等。
总用量非实时更新,数据统计可能会有几小时延迟。
您还可以查看所有 Pipelines 相关事件。
调用以下 API 查看所有 Pipelines 或查看某一特定 Pipeline 详情。
-
查看所有 Pipelines
根据以下示例并指定项目 ID
projectId
。了解如何获取项目 ID。curl --request GET \
--header "Content-Type: application/json" \
--header "Authorization: Bearer ${YOUR_API_KEY}" \
--url "https://controller.api.{cloud-region}.cloud.zilliz.com.cn/v1/pipelines?projectId=proj-xxxx"如果请求返回以下类似内容,则表示操作成功:
{
"code": 200,
"data": [
{
"pipelineId": "pipe-xxxx",
"name": "my_text_ingestion_pipeline",
"type": "INGESTION",
"createTimestamp": 1721187655000,
"clusterId": "in03-***************",
"collectionName": "my_collection"
"description": "A pipeline that generates text embeddings and stores additional fields.",
"status": "SERVING",
"totalUsage": {
"embedding": 0
},
"functions": [
{
"action": "INDEX_TEXT",
"name": "index_my_text",
"inputFields": ["text_list"],
"language": "ENGLISH",
"embedding": "zilliz/bge-base-en-v1.5"
},
{
"action": "PRESERVE",
"name": "keep_text_info",
"inputField": "source",
"outputField": "source",
"fieldType": "VarChar"
}
]
},
{
"pipelineId": "pipe-xxxx",
"name": "my_text_search_pipeline",
"type": "SEARCH",
"createTimestamp": 1721187655000,
"description": "A pipeline that receives text and search for semantically similar texts",
"status": "SERVING",
"totalUsage": {
"embedding": 0,
"rerank": 0
},
"functions":
{
"action": "SEARCH_TEXT",
"name": "search_text",
"inputFields": "query_text",
"clusterId": "in03-***************",
"collectionName": "my_collection",
"embedding": "zilliz/bge-base-en-v1.5",
"reranker": "zilliz/bge-reranker-base"
}
},
{
"pipelineId": "pipe-xxxx",
"name": "my_text_deletion_pipeline",
"type": "DELETION",
"createTimestamp": 1721187655000,
"description": "A pipeline that deletes entities by expression",
"status": "SERVING",
"functions":
{
"action": "PURGE_BY_EXPRESSION",
"name": "purge_data_by_expression",
"inputFields": ["expression"]
},
"clusterId": "in03-***************",
"collectionName": "my_collection"
}
]
}📘说明总用量
totalUsage
非实时更新,数据统计可能会有几小时延迟。 -
查看特定 Pipeline 详情
根据以下示例查看某一 Pipeline 详情。
curl --request GET \
--header "Content-Type: application/json" \
--header "Authorization: Bearer ${YOUR_API_KEY}" \
--url "https://controller.api.{cloud-region}.cloud.zilliz.com.cn/v1/pipelines/${YOUR_PIPELINE_ID}"如果请求返回以下类似内容,则表示操作成功:
{
"code": 200,
"data": {
"pipelineId": "pipe-xxx",
"name": "my_text_ingestion_pipeline",
"type": "INGESTION",
"createTimestamp": 1721187300000,
"description": "A pipeline that generates text embeddings and stores additional fields.",
"status": "SERVING",
"totalUsage": {
"embedding": 0
},
"functions": [
{
"name": "index_my_text",
"action": "INDEX_TEXT",
"inputFields": ["text_list"],
"language": "ENGLISH",
"embedding": "zilliz/bge-base-en-v1.5"
},
{
"name": "keep_text_info",
"action": "PRESERVE",
"inputField": "source",
"outputField": "source",
"fieldType": "VarChar"
}
],
"clusterId": "inxx-xxxx",
"collectionName": "my_collection"
}
}📘说明总用量
totalUsage
非实时更新,数据统计可能会有几小时延迟。
删除 Pipeline
您可以删除不再需要使用的 Pipelines。该操作仅删除 Pipeline,不会影响自动创建的 Collection。
该操作仅删除 Pipeline,不会影响自动创建的 Collection。
Pipeline 一旦删除后不可恢复,请谨慎操作。
删除 Ingestion pipeline 时不会影响其相关联的 Collection。您的数据十分安全。
- Cloud Console
- cURL
如需删除不再使用的 Pipeline,请点击操作栏中的**“...”按钮并选择删除**。
根据以下示例删除 Pipelines。
curl --request GET \
--header "Content-Type: application/json" \
--header "Authorization: Bearer ${YOUR_API_KEY}" \
--url "https://controller.api.{cloud-region}.cloud.zilliz.com.cn/v1/pipelines/${YOUR_PIPELINE_ID}"
如果请求返回以下类似内容,则表示操作成功:
{
"code": 200,
"data": {
"pipelineId": "pipe-xxx",
"name": "my_text_ingestion_pipeline",
"type": "INGESTION",
"createTimestamp": 1721187300000,
"description": "A pipeline that generates text embeddings and stores additional fields.",
"status": "SERVING",
"totalUsage": {
"embedding": 0
},
"functions": [
{
"name": "index_my_text",
"action": "INDEX_TEXT",
"inputFields": ["text_list"],
"language": "ENGLISH",
"embedding": "zilliz/bge-base-en-v1.5"
},
{
"name": "keep_text_info",
"action": "PRESERVE",
"inputField": "source",
"outputField": "source",
"fieldType": "VarChar"
}
],
"clusterId": "inxx-xxxx",
"collectionName": "my_collection"
}
}
总用量 totalUsage
非实时更新,数据统计可能会有几小时延迟。