开启左侧

向量数据库调研

[复制链接]
双木迎光 发表于 4 小时前 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
作者:CSDN博客
背景

随着行业内AI战略的铺开。 知识的存储跟表达也有了新的标准。对于向量数据产生了存储检索的需求。向量这个数学表达,在目前是人与AI交互的中间媒介。 所以我们有必要深入探讨向量数据库,并对当前主流的数据库做一些对比分析。
什么是向量数据库?

简单下个定义,因为喂给Transformer的知识首先需要做embedding,所以用于存储embedding之后数据的数据库即可称为向量数据库。
向量数据库需要解决什么问题?因为向量数据库是基于embedding之后的向量的存储与检索。所以首先需要提供存储能力,其次更重要的是检索。
即如何根据一个query快速找到相关的embedding内容。
关于检索,主要是计算两个向量之间的相似度。
推荐的计算两个向量之间距离推荐的算法为: 余弦相似度函数, 其表达式如下:
向量数据库调研-1.png


常见的向量数据库

向量检索是一个革命性的技术,使得开发者和工程师可以将知识或数据向量化之后实现更有效的存储、检索以及推荐。
通过对比这些向量两两之间的相似性,可以实现快速、直观、无缝的信息检索。
Pinecone: 一个全托管的矢量数据库

Pinecone是一个专门为工程师与开发者设计的向量数据库。 作为一个全托管的服务,它减轻了工程师以及运维人员的负担,使

原文地址:https://blog.csdn.net/qq_35667076/article/details/136446349
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

发布主题
阅读排行更多+

Powered by Discuz! X3.4© 2001-2013 Discuz Team.( 京ICP备17022993号-3 )