大模型Rag - 向量数据库

夏至的血染葵花 · 发表于 2025-9-18 21:50:20

作者：CSDN博客
一、什么是向量数据库？

向量数据库（Vector Database）是专门为存储和查询高维向量而设计的数据库系统。它主要应用于语义检索、推荐系统、图像识别等场景，通过 embedding 模型将非结构化数据（如文本）转化为向量，再利用向量数据库完成存储与高效检索。
与关系型数据库的核心区别

特性	关系型数据库	向量数据库
存储数据类型	多种字段类型（int, string 等）	向量（float 数组）和文档
检索方式	精确匹配、范围查询	相似度匹配（向量距离）
索引结构	B+ 树、哈希索引	IVF、PQ、HNSW 等向量索引
应用场景	结构化数据管理	非结构化数据语义搜索

向量数据库的核心能力体现在高效的相似度检索，它必须在大规模向量集合中快速找到“最接近”的向量，而不仅仅是相等匹配。
二、主流向量数据库盘点

当前向量数据库生态大致可以分为两类：

三、Chroma：轻量易用的向量数据库

Chroma 是一款开源、AI 原生的向量数据库，支持本地和服务端部署。它为开发者提供了简洁的 API 和开箱即用的体验，适合中小型项目的快速开发。
核心特性

四、Milvus：工业级向量数据库之选

Milvus 是由 Zilliz 开发的云原生向量数据库，具备强大的横向扩展能力，适用于千万甚至亿级向量的管理。
核心特性

五、Chroma 与 Milvus 对比总结

特性维度 Chroma Milvus
上手难度 ⭐⭐⭐⭐☆（易上手） ⭐⭐☆☆☆（较复杂）
部署方式本地 / 服务端本地 / 服务端 / 分布式
可扩展性中等高
检索能力支持元数据 + 向量检索支持更多相似度度量与索引算法
权限与监控暂不支持支持角色权限、监控与日志功能
适合项目规模中小型中大型
六.索引

Flat 索引（全表扫描）

Flat 是最原始的方式，它直接对每一个向量进行逐个计算相似度并排序。
✅ 优点：100% 精度
❌ 缺点：速度慢，不适合大数据量
适合场景：

IVF 倒排索引

IVF（Inverted File Index）通过KMeans 聚类将向量集合分成多个簇，在检索时先找到最相近的簇，再在簇内做局部扫描。

25位大厂高管转战生成式AI创业！吸金猛，不

大模型Rag - 向量数据库

浏览过的版块

OpenClaw入门教程：从安装到上手的完整指南

关于我们

产品与服务

解决方案

产品与服务