作者:CSDN博客
什么是向量数据库?向量数据库该怎么选?
这篇文章帮你梳理一下向量数据库的核心概念、工作原理和主流产品对比。
先用一个架构图帮你直观理解向量数据库在整个 AI 技术栈中的位置和工作原理。
一、什么是向量数据库
向量数据库是专门面向高维向量(Embedding嵌入向量),提供存储、索引、高效检索与管理能力的专用数据库,是RAG、AI智能体、语义搜索、个性化推荐等AI应用的核心底层组件。其核心核心能力是近似相似性搜索:输入一个查询向量,快速召回向量空间中距离最近、语义最相似的Top-K结果。
下面这张图展示了向量数据库在 AI 应用中的典型架构位置:
为什么需要向量数据库?
传统数据库(MySQL、PostgreSQL)擅长精确匹配——“找到 id=42 的行”。但 AI 场景需要的是语义相似——“找到和’猫科动物’含义最接近的文档”。传统数据库做不了这个事,因为: