跳到主要内容

搜索与重排

Milvus 商业版提供向量搜索功能,并针对向量搜索性能推出多种优化方案。在本章中,您将了解包括基本相似最近邻搜索(ANN)在内的多种搜索方式的原理、使用和相关注意事项。

全文搜索 [READ MORE]

在 Zilliz Cloud 中,全文搜索是对基于稠密向量](./use-dense-vector)的语义搜索的补充。它能够在大规模文本集合中查找包含特定术语或短语的文本,弥补语义搜索的遗漏,从而提升整体搜索效果。它支持直接插入和使用原始文本数据进行相似性搜索,Milvus 会自动将文本转换为[稀疏向量](./use-sparse-vector)表示。全文搜索使用 [BM25 算法进行相关性评分,根据查询文本返回最相关的文档,从而提高文本搜索的整体精度。

Elasticsearch 查询语句转换 [READ MORE]

基于 Apache Lucene 构建的Elasticsearch是领先的开源搜索引擎。然而,它在现代 AI 应用程序中面临挑战,包括高更新成本、较差的实时性能、低效的分片管理、非云原生设计以及过度的资源需求。作为云原生向量数据库,Zilliz Cloud 通过解耦的存储和计算、高维数据的高效索引以及与现代基础设施的无缝集成克服了这些问题,并为 AI 工作负载提供了卓越的性能和可扩展性。

使用 mmap [READ MORE]

Mmap 允许在不将磁盘上的文件加载到内存的情况下通过内存访问这些文件。通过配置 mmap,Zilliz Cloud 可以根据访问频次的不同将索引和数据分别存放到内存或磁盘上,不仅优化了数据加载行为,扩大了 Collection 的容量,也不会给搜索性能带来负面影响。本文将帮助您理解 Zilliz Cloud 如何利用 mmap 实现快速高效的数据存储和检索能力及使用该能力需要注意的相关事项。