登陆注册

返回顶部

AI创想 › 综合版块 › 向量数据库 › LLM-向量数据库中的索引算法总结

25位大厂高管转战生成式AI创业！吸金猛，不

[hr] 智东西作者李水青编辑心缘智东西7月2日报道，今年3月智东西曾报道，超14位互联网大厂离职高管详细

[大模型AI] 25位大厂高管转战生成式AI创业！吸金猛，不 07-03

[大模型AI] 大模型本地知识库 04-13

[课程库] 国产GPU龙头AI算力产品登场 22天暴涨121%！ 03-14

[大模型AI] 百度王海峰谈通用人工智能：技术通用、能力 07-03

[大模型AI] 让企业为大模型买单，目前有四大难 07-03

[大模型AI] 打造OpenAI GPT超算：微软云上生成式AI创新 03-13

国产GPU龙头AI算力产品登场 22天暴涨121%！

历史与AI的距离：聊天机器人在历史学科科研

打造OpenAI GPT超算：微软云上生成式AI创新

AI智能体的协议MCP详解

OpenClaw Skills怕被投毒？Cisco-ai-skill-

openclaw部署

LangGraph 介绍

深入解析 LangChain：架构、核心概念与实践

开启左侧

LLM-向量数据库中的索引算法总结

[复制链接]

爱爱尔尔兰 发表于 2026-4-26 08:08:39 | 显示全部楼层 |阅读模式

上一主题

下一主题

作者：一切如来心秘密
文章目录

前言

向量数据库是当今大模型知识库检索落地实践的核心组件，下图是构建知识库检索的架构图：

LLM-向量数据库中的索引算法总结-1.png

向量查询的数据与 query 的相似度，直接影响到 prompt 的好坏，本文将对市面上已有的向量数据库进行简单介绍，然后会对其使用到的索引方法进行说明，包括倒排索引，KNN，Approximate KNN, Product Quantization, HSNW 等，会对这些算法的设计理念和方法进行说明。

向量数据库介绍

LLM-向量数据库中的索引算法总结-2.png

目前开源的比较火的三大向量数据库为 Chroma, Milvus, Weaviate，关于他们的介绍与区别这篇文章我觉得讲的不错，感兴趣的可以看下：三大开源向量数据库大比拼。
下边是开源向量数据库的发展历程：

LLM-向量数据库中的索引算法总结-3.png

它们用到的索引方法如下：

LLM-向量数据库中的索引算法总结-4.png

索引方法

倒排索引

LLM-向量数据库中的索引算法总结-5.png

假如现在我有一个使用倒排索引的数据库，其中存储了10的12次方个索引数据，我们在往数据库中存储数据的时候，会将数据切分，然后记录被切分后的单词对应的索引位置有哪些, 因为不同句子可能会出现相同的单词，因此每个单词对应的是一个索引集合：

原文地址：https://blog.csdn.net/qq_42586468/article/details/140368129

回复

使用道具举报

返回列表发表新帖

爱爱尔尔兰新手上路

关注0

粉丝0

帖子2

发布主题

推荐阅读更多+

0

基于RAG的企业智能客服项目，已拿70万offer

OpenClaw安装openclaw-dashboard监控面板06-17

基于RAG的企业智能客服项目，已拿70万offer06-17

Ollama+LangGraph构建本地化法律AI工作流：06-17

【OpenClaw】OpenClaw 卸载指南：从标准卸06-17

零代码部署 OpenClaw Windows 版详细步骤+06-17

一文讲清楚OpenClaw是什么，以及Windows下06-13

OpenClaw 本地部署教程｜Windows 可视化安06-13

阅读排行更多+

1 25位大厂高管转战生成式AI创业！吸金猛，不

[hr] 智东西作者李水青编辑心缘智东西7月2日报道，今年3月智东西曾报道，超14

阅读：11613|2024-07-03

2 大模型本地知识库

1、访问查看知识库详情https://llms-ai.com/portal.php?mod=list&catid=2 2

阅读：10437|2024-04-13

3 国产GPU龙头AI算力产品登场 22天暴涨121%！

[hr] 　　国产算力需求持续强劲。　　今日早盘，AI方向全线逆市上扬，通信、传媒、

阅读：9833|2024-03-14

4 百度王海峰谈通用人工智能：技术通用、能力

[hr] 王海峰发布“农民院士智能体”。 ■本报记者赵广立 “旱稻什么时候种最好

阅读：9770|2024-07-03

5 让企业为大模型买单，目前有四大难

[hr]

阅读：9685|2024-07-03

6 打造OpenAI GPT超算：微软云上生成式AI创新

[hr] 这是微软Azure首席技术官Mark最近在一次斯坦福大学研讨会上的演讲内容。全面介

阅读：9189|2024-03-13

7 RAG本地知识库实践

一、大模型本地部署二、智能体Dify本地搭建三、智能体Dify本地安装四、Dify本地知

阅读：8202|2024-03-14

8 豆包文科成绩超了一本线，为什么理科不行？

[hr] 金磊发自凹非寺量子位 | 公众号 QbitAI 什么？好多大模型的文科成绩超一本

阅读：7877|2024-07-03

9 AIGC 与 AI 技术谱系：从生成内容到大语言

人工智能技术的飞跃发展，尤其是大语言模型的应用，正深刻改变信息生产和交流的方式。

阅读：7792|2024-03-13

10 成都人形机器人项目 5年实现量产上市

原标题：以人工智能技术催生新质生产力让科幻走进现实成都人形机器人项目 5年实现量

阅读：7180|2024-03-13

用心服务创业者

www.llms-ai.com

AI创想

Powered by Discuz! X3.4© 2001-2013 Discuz Team.( 京ICP备17022993号-3 )