跳到主要内容

Lowercase
公测版

Lowercase 过滤器将分词器生成的词项转换为小写,使搜索不区分大小写。例如,它可以将 ["High", "Performance", "Vector", "Database"] 转换为 ["high", "performance", "vector", "database"]

配置

Lowercase 过滤器内置于 Zilliz Cloud。要使用它,只需在 analyzer_params 的过滤器部分指定其名称。

analyzer_params = {
"tokenizer": "standard",
"filter": ["lowercase"],
}

Lowercase 过滤器作用于分词器生成的词项,因此必须与分词器结合使用。有关 Zilliz Cloud 中可用的分词器列表,请参阅分词器参考

定义 analyzer_params 后,您可以在定义 Collection Schema 时将其应用于 VARCHAR 字段。这使得 Zilliz Cloud 能够使用指定的分析器处理该字段中的文本,以实现高效的分词和过滤。更多信息,请参阅使用示例

示例输出

以下是 Lowercase 过滤器处理文本的示例:

原始文本

"The Lowercase Filter Ensures Uniformity In Text Processing."

预期输出

["the", "lowercase", "filter", "ensures", "uniformity", "in", "text", "processing"]