开启左侧

大语言模型学习--向量数据库基础知识

[复制链接]
AI小编 发表于 2 小时前 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
作者:CSDN博客
1.向量

向量是多维数据空间中的一个坐标点。
大语言模型学习--向量数据库基础知识-1.png


向量类型
图像向量 文本向量  语音向量
大语言模型学习--向量数据库基础知识-2.png


Embedding
非结构化数据转换为向量过程
通过深度学习训练,将真实世界离散数据,投影到高维数据空间上,通过数据在空间中间的距离体现真实世界的相似度
大语言模型学习--向量数据库基础知识-3.png


Vector Embedding 向量嵌入
将非数值词语符号等非结构化数据编码成数值向量
Word Embedding 词嵌入
通过NN学习,文本中词语作为NN输入,输出对应词向量 Word Vector。词向量是一个数值向量,每个数值代表词语的某个特征
大语言模型学习--向量数据库基础知识-4.png


向量的每个数值表示某个特征,只要向量足够大,特征区分足够明显

原文地址:https://blog.csdn.net/u014106644/article/details/146107030
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

发布主题
阅读排行更多+

Powered by Discuz! X3.4© 2001-2013 Discuz Team.( 京ICP备17022993号-3 )