例:“今天天气很好” → [0.023, -0.156, 0.891, 0.045, ..., -0.332](1536维)2. 相似度度量
| 度量方式 | 公式 | 适用场景 |
| 余弦相似度 | cos(A,B) = A·B / (|A|×|B|) | 文本检索,关注方向不关注长度 |
| 欧氏距离 (L2) | d = √Σ(aᵢ-bᵢ)² | 图像检索,关注绝对距离 |
| 内积 (IP) | A·B = Σaᵢ×bᵢ | 推荐、MaxSim 检索 |
| 算法 | 原理 | 召回率 | 速度 | 内存 | 代表产品 |
| HNSW | 分层可导航小世界图 | 高 | 快 | 高 | Qdrant, Weaviate, Milvus |
| IVF | 倒排文件 + K-Means 聚类 | 中高 | 中 | 中 | Milvus, FAISS |
| PQ | 乘积量化压缩 | 中 | 快 | 低 | FAISS |
| HNSW+PQ | 图索引 + 量化压缩 | 高 | 快 | 中 | Qdrant |
| DiskANN | 磁盘优化图索引 | 高 | 中 | 极低 | Milvus |
| 维度 | Pinecone | Milvus | Qdrant | Weaviate | pgvector | ChromaDB |
| 开源 | 闭源 | 开源 (LF AI & Data) | 开源 (Apache 2.0) | 开源 (BSD-3) | 开源 (PostgreSQL 扩展) | 开源 (Apache 2.0) |
| 核心语言 | 未公开 | Go + C++ | Rust | Go | C | Python |
| 首发年份 | 2021 | 2019 | 2021 | 2021 | 2021 | 2022 |
| 部署方式 | 全托管云 | 自托管 / Zilliz Cloud | 自托管 / Qdrant Cloud | 自托管 / Weaviate Cloud | PostgreSQL 扩展 | 嵌入式 / Server |
| 许可证 | 商业 | Apache 2.0 | Apache 2.0 | BSD-3 | PostgreSQL License | Apache 2.0 |
| GitHub Stars | N/A | 30k+ | 22k+ | 14k+ | 13k+ | 18k+ |
| 维度 | Pinecone | Milvus | Qdrant | Weaviate | pgvector | ChromaDB |
| 索引算法 | 专有 | HNSW/IVF/PQ/DiskANN/GPU | HNSW (含量化) | HNSW | HNSW/IVF | HNSW |
| 稀疏向量 | 支持 | 支持 | 支持 | 支持 | 不支持 | 有限 |
| 混合检索 | 支持 | 支持 | 支持 | 支持 | 需组合 | 有限 |
| 元数据过滤 | 支持 | 支持 | 强大 | 支持 | SQL WHERE | 支持 |
| 全文搜索 | 不支持 | 不支持 | 支持 | 支持 | PG 原生 | 不支持 |
| 分布式 | 内置 | 原生分布式 | 分布式集群 | 集群模式 | 依赖 PG | 不支持 |
| GPU 加速 | 不支持 | 支持 | 不支持 | 不支持 | 不支持 | 不支持 |
| 多租户 | Namespace | Partition | Collection | 多租户 | 手动实现 | 不支持 |
| RBAC | 支持 | 支持 | 支持 | 支持 | PG 原生 | 不支持 |
| 最大向量规模 | 取决于套餐 | 百亿级 | 十亿级 | 十亿级 | 百万级(推荐) | 百万级 |
| 场景 | 最优选择 | 关键指标 |
| 中小规模 (<1M) 高性能 | Qdrant | P99 延迟 ~15ms,纯 CPU |
| 高维向量 (1024+) | Milvus | GPU 加速,延迟最低 |
| 超大规模 (>10M) | Milvus | DiskANN 索引,百亿级 |
| 简单场景低成本 | pgvector | 依赖 PG 基础设施,增量成本 ~0 |
| 快速原型验证 | ChromaDB | 本地运行,极简部署 |
| 产品 | 12个月 TCO | 说明 |
| Pinecone | ~$840 - $2,760/年 | 全托管,按量计费,零运维 |
| Milvus (Zilliz Cloud) | ~$780/年起 | 云托管版,需运维人力 |
| Qdrant (自托管) | ~$660/年 | 服务器 + EBS + 10% 运维 |
| pgvector | ~$130/年 | 已有 PG 则增量成本极低 |
| ChromaDB | $0 | 本地嵌入式,完全免费 |
| 产品 | 一句话定位 |
| Pinecone | "我有钱但不想要运维"团队的首选,全托管零配置 |
| Milvus | 企业级重型选手,CNCF 毕业,适合百亿级数据和 GPU 加速 |
| Qdrant | Rust 写的性能怪兽,过滤查询能力最强,性价比之王 |
| Weaviate | 语义搜索专家,内置向量化模块,GraphQL API 友好 |
| pgvector | “别过度工程化”,已有 PG 就别再引入新系统了 |
| ChromaDB | LLM 开发者的玩具数据库,5 分钟跑起来,适合原型,不建议正式生产使用 |
| 欢迎光临 AI创想 (https://llms-ai.com/) | Powered by Discuz! X3.4 |