| 数据库类型 | 数据模型 | 核心功能 | 典型场景 |
| 向量数据库 | 高维向量(如512维浮点数组) | 相似性搜索(余弦、欧氏距离等) | 图像/文本检索、推荐系统、AI模型嵌入 |
| 关系型数据库(MySQL) | 结构化表格(行与列) | SQL查询、ACID事务、复杂关联查询 | 金融交易、ERP系统、结构化数据管理 |
| 文档数据库(MongoDB) | JSON/BSON文档(半结构化) | 灵活查询、嵌套文档存储 | 日志存储、用户配置、内容管理系统 |
| 键值数据库(Redis) | 键-值对(简单数据结构) | 高速缓存、原子操作 | 会话缓存、排行榜、实时计数器 |
| 搜索引擎(Elasticsearch) | 文本+倒排索引 | 全文检索、模糊匹配、聚合分析 | 日志分析、电商搜索、文本内容检索 |
| 数据库类型 | 查询特点 |
| 向量数据库 | 基于向量距离的近似最近邻(ANN)搜索,支持相似性排序(如 Top-K 结果) |
| 关系型数据库 | 基于SQL的精确查询,支持JOIN、GROUP BY等复杂操作,强调数据一致性 |
| 文档数据库 | 基于文档字段的灵活查询(如嵌套查询、范围过滤),支持部分索引 |
| 键值数据库 | 基于键的精确读写,支持简单范围查询(如 SCAN),但无复杂关联操作 |
| 搜索引擎 | 基于关键词的全文检索,支持模糊匹配、分词、相关性评分(TF-IDF/BM25) |
| 数据库类型 | 性能优化重点 | 瓶颈 |
| 向量数据库 | 高维向量索引(如HNSW、IVF-PQ)加速相似性搜索 | 高维数据计算复杂度高,内存占用大 |
| 关系型数据库 | 事务处理、索引优化(B+树)、锁机制 | 复杂JOIN和大表查询的延迟 |
| 文档数据库 | 文档结构灵活性、分片扩展性 | 嵌套层级过深时的查询效率下降 |
| 键值数据库 | 低延迟读写、内存优化 | 数据持久化与内存成本的平衡 |
| 搜索引擎 | 倒排索引压缩、分词效率、分布式查询 | 高基数字段的聚合性能(如去重统计) |
| 场景 | 推荐数据库 | 原因 |
| 人脸识别1:N检索 | 向量数据库(如Milvus、Pinecone) | 需快速比对海量高维向量,支持ANN索引和GPU加速 |
| 电商订单管理 | 关系型数据库(MySQL) | 需要事务支持、订单状态一致性及复杂关联查询 |
| 用户行为日志存储 | 文档数据库(MongoDB) | 半结构化日志格式灵活,支持动态字段扩展 |
| 实时在线游戏排行榜 | 键值数据库(Redis) | 低延迟读写,支持有序集合(ZSET)实现实时排名 |
| 新闻内容全文检索 | 搜索引擎(Elasticsearch) | 支持分词、相关性排序、高亮显示等文本特性 |
| 维度 | 向量数据库 | 其他数据库 |
| 数据本质 | 非结构化高维向量(AI生成) | 结构化或半结构化数据(文本、数值、文档等) |
| 查询目标 | 相似性匹配(模糊结果) | 精确匹配或范围查询 |
| 索引技术 | ANN索引(如HNSW、Faiss) | B+树、倒排索引、哈希索引等 |
| 硬件依赖 | 依赖GPU/高性能计算加速向量运算 | 通常依赖CPU和内存优化 |
| 扩展性 | 分布式向量索引,横向扩展集群 | 分库分表(关系型)或分片(NoSQL) |
| 数据库 | 开源 | 收费模式 | 适用场景 | 出品方 | 核心优势 |
| Milvus | 是 | 社区免费/企业付费 | 企业级大规模检索、多模态应用 | Zilliz(中国) | 分布式扩展、国产化支持 |
| Pinecone | 否 | SaaS按需付费 | 快速部署、实时搜索 | Pinecone(美国) | 全托管、易用性高 |
| Chroma | 是 | 免费/托管收费 | 轻量级开发、多媒体检索 | 开源社区 | 安装便捷、适合原型验证 |
| Faiss | 是 | 免费 | 高性能计算、算法研究 | Meta | GPU加速、高计算效率 |
| Weaviate | 是 | 社区免费/企业付费 | 语义搜索、知识图谱集成 | SeMI Technologies | 模块化、多模态支持 |
| Qdrant | 是 | 免费/托管收费 | 高精度混合检索 | 开源社区 | 性能均衡、混合搜索支持 |
| 关键技术 | 作用 |
| ANN算法(如HNSW) | 将搜索复杂度从O(N)降至O(logN),支持十亿级数据毫秒响应。 |
| 语义向量化 | 将文本语义编码为稠密向量,突破关键词匹配局限(如近义词、抽象概念)。 |
| 内存优化存储 | 列式存储+SIMD指令加速向量运算,提升吞吐量。 |
| 并行计算 | 多线程/GPU加速距离计算,适合高并发场景。 |
| 欢迎光临 AI创想 (https://llms-ai.com/) | Powered by Discuz! X3.4 |