开启左侧

终于有人把“智能体”的概念给我讲明白了!

[复制链接]
创想小编 发表于 昨天 11:58 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
作者:悟鸣
前段时间团队的实习生跑来问我,能不能给他讲一讲什么是智能体?
她说她看了很多资料,但是还是有些模糊。
也有一些粉丝会在群里问过类似的问题。
还有我接触到的一些大学老师,甚至有一些搞 AI 应用的人也讲不太清楚。
终于有人把“智能体”的概念给我讲明白了!-1.png


那我借着这篇文章,用相对通俗易懂的语言帮助大家更好地理解这个概念。
大家不用担心,不管你是程序员、老师还是销售,这篇文章你都能看懂,看完之后都能对智能体有进一步的了解。
通俗讲解

终于有人把“智能体”的概念给我讲明白了!-2.png


台湾大学李宏毅教授的《生成式 AI 时代的机器学习(2025)》第二讲中就提到:
AI Agent 没有标准的定义。
以前我们使用大模型的主要方式就是打开对话框,提出问题,它给出回答。
AI Agent (AI 智能体)则是我们提出目标,AI 自己去思考规划、调用各种工具,最终帮我们达成这个目标。
终于有人把“智能体”的概念给我讲明白了!-3.png


比如说你让 AI 智能体去帮你在购物网站上挑选某个商品,那么 AI 智能体会打开浏览器,执行各种搜索,然后挑选出符合你要求的商品。
能力层面

从能力层面来讲,他并不关心智能体内部实现,更关心“AI 完成任务的占比”。


如果是从能力层面来讲的话:
ChatGPT 就相当于我们直接在对话框里问问题,然后它给一些建议,我们需要自己再回去处理工作。
那么像 Cursor、Claude Code 这种就是人类和 AI 一起协作,工作量基本相当。
而 Agent 的话,其实需要 AI 完成更多工作,人类主要负责设定目标、提供资源、监督结果。Agent 需要自主完成任务拆解、工具选择、进度控制,实现后自主结束工作。
结构层面

终于有人把“智能体”的概念给我讲明白了!-5.png


在复旦大学 NLP团队的一篇智能体综述《The Rise and Potential of Large Language Model
Based Agents: A Survey》中,主要提到大语言模型驱动的智能体的概念。
其中提到基于大语言模型的智能体,主要包括三个组件:一个是大脑,一个是感知,一个是行动。
它可以感知环境,获取输入可能是文本、图片、视频、音频等。它有“大脑”可以进行规划、存储,也能执行各种行动,包括输出文本、调用工具、操作机械臂等。
终于有人把“智能体”的概念给我讲明白了!-6.png


在 Google 的智能体白皮书中提到智能体,主要包括编排、模型和工具。
在编排中主要包括配置指令、目标,以及 memory(记忆),以及推理和规划。
模型的话通常指现在的大语言模型。
工具的话可能是浏览器,可能是搜索引擎,可能是计算器等。
终于有人把“智能体”的概念给我讲明白了!-7.png


比如说用户说想让智能体帮订一个机票:
终于有人把“智能体”的概念给我讲明白了!-8.png
终于有人把“智能体”的概念给我讲明白了!-9.png
终于有人把“智能体”的概念给我讲明白了!-10.png
终于有人把“智能体”的概念给我讲明白了!-11.png
终于有人把“智能体”的概念给我讲明白了!-12.png
终于有人把“智能体”的概念给我讲明白了!-13.png
终于有人把“智能体”的概念给我讲明白了!-14.png
终于有人把“智能体”的概念给我讲明白了!-15.jpg
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

发布主题
阅读排行更多+

Powered by Discuz! X3.4© 2001-2013 Discuz Team.( 京ICP备17022993号-3 )