向量数据库是一种专门为存储、索引和高效检索高维向量数据而设计的数据库管理系统。它通过计算向量之间的相似度(如余弦相似度或欧氏距离),实现基于语义或特征相似性的快速近邻搜索,是处理非结构化数据(如图像、文本、音频)的核心基础设施。
想象一个巨大的图书馆,传统数据库通过书名或作者名(精确关键词)找书,而向量数据库则通过“这本书的风格和内容与哪几本最相似”来推荐书籍。其工作流程可分为三步:首先,利用嵌入模型将文本、图片等原始数据转化为数学上的高维向量(即一组数字),这个向量代表了数据的深层特征。其次,数据库使用专门的近似最近邻搜索算法(如HNSW、IVF)对这些向量建立索引,该索引结构允许系统在海量数据中快速定位目标,而无需逐一精确计算。最后,当用户输入查询(例如一段问题或一张图片)时,查询内容同样被转化为向量,系统通过索引快速找出库中与之最相似的向量,并返回对应的原始数据。

嵌入、
近似最近邻搜索、
语义搜索、
检索增强生成、
大型语言模型、
向量索引

若想深入了解,可探索ANN算法(如HNSW、PQ)的原始论文,以及开源向量数据库(如Milvus、Weaviate)的官方文档与技术架构解析。了解不同距离度量标准(余弦相似度、内积、欧氏距离)对搜索结果的影响,也是深入掌握其原理的关键。