搜索与重排
Milvus 商业版提供向量搜索功能,并针对向量搜索性能推出多种优化方案。在本章中,您将了解包括基本相似最近邻搜索(ANN)在内的多种搜索方式的原理、使用和相关注意事项。
基本 Vector Search [READ MORE]
近似最近邻(ANN)Search 通过构建索引的方式对向量空间中的向量进行预排序,并在收到 Search 请求时根据索引快速定位到与查询向量相似可能性较高的子集中进行对比查询,从而提升查询效率。本节主要介绍如何使用 Milvus 进行 ANN Search 及相关的注意事项。
Filtered Search [READ MORE]
近似最近邻(ANN) Search 可以根据指定的非结构化数据(向量)找到与之相似的一批非结构化数据(向量),但是无法做到精确匹配。对于简单的精确匹配需求,可以使用过滤条件表达式基于部分标量字段进行文本过滤。本节将介绍如何在 ANN Search 中使用过滤条件表达式及相关注意事项。
Range Search [READ MORE]
Range Search 是一种通过指定搜索结果的相似度得分范围的方式提升 ANN Search 的召回质量的搜索增强方法。本节将介绍如何使用 Range Search 以及相关注意事项。
Grouping Search [READ MORE]
如果搜索结果中所有 Entity 在某个标量字段上的取值都相同时,搜索结果可能并不能真实反映与查询向量相似的所有向量在向量空间中的分布情况。为了提升召回结果的多样性,可以考虑使用 Grouping Search。本节将介绍如何使用 Grouping Search 以及与之相关的注意事项。
Hybrid Search [READ MORE]
Hybrid Search 是指同时进行多路搜索,对多路搜索的结果进行重排,最终返还单路结果的搜索方式。使用 Hybrid Search 能够提升搜索结果的准确性。
Query [READ MORE]
Zilliz Cloud 除了支持 ANN Search 外,还提供基于标量的过滤查询功能。本节将介绍如何使用 Query、Get 和 QueryIterator 进行标量查询以及进行标量查询时的注意事项。
过滤表达式 [READ MORE]
本章将介绍如何在标量字段上进行过滤以及支持的过滤操作符。
Search Iterator [READ MORE]
ANN Search 单次召回的 Entity 有最大数量限制,单纯使用基本 ANN Search 可能无法应对大规模召回的需求。对于 topK 大于 16,384 的 ANN Search 请求,可以考虑使用 Search Iterator。本节将介绍如何使用 Search Iterator 以及与相关的注意事项。
使用 Partition Key [READ MORE]
Partition Key 是一种基于 Partition 的搜索优化方案。通过指定某个标量字段为 Partition Key 并在搜索时指定基于 Partition Key 的过滤条件表达式将搜索范围缩小到若干 Partition 中,从而提高搜索效率。本文将介绍如何使用 Partition key 及相关注意事项。
使用 mmap [READ MORE]
Mmap 允许在不将磁盘上的文件加载到内存的情况下通过内存访问这些文件。通过配置 mmap,Zilliz Cloud 可以根据访问频次的不同将索引和数据分别存放到内存或磁盘上,不仅优化了数据加载行为,扩大了 Collection 的容量,也不会给搜索性能带来负面影响。本文将帮助您理解 Zilliz Cloud 如何利用 mmap 实现快速高效的数据存储和检索能力及使用该能力需要注意的相关事项。
一致性水平 [READ MORE]
作为一款分布式向量数据库,Zilliz Cloud 提供了多种一致性水平来确保在数据读写期间每个节点或副本都能获取到相同的数据。当前,支持使用的一致性水平包括 Strong、Bounded、Eventually 。其中,Bounded 是默认使用的一致性水平。
相似度类型 [READ MORE]
在度量向量相似性时,相似度类型发挥着关键作用。选择恰当的相似度类型可以极大地提升分类与聚类的效果。
Reranking [READ MORE]
Zilliz Cloud Hybrid Search 功能通过多路搜索单路召回实现更精准的搜索结果。多路搜索会返回多组结果,因此需要通过 Reranking 对多组搜索结果进行重新排序,最终合并成一组结果,实现单路召回。本节将介绍 Zilliz Cloud 中支持的 Reranking 策略并指导您挑选合适的 Reranking 策略。