AI创想

标题: 终于有人把“智能体”的概念给我讲明白了! [打印本页]

作者: 创想小编    时间: 昨天 11:58
标题: 终于有人把“智能体”的概念给我讲明白了!
作者:悟鸣
前段时间团队的实习生跑来问我,能不能给他讲一讲什么是智能体?
她说她看了很多资料,但是还是有些模糊。
也有一些粉丝会在群里问过类似的问题。
还有我接触到的一些大学老师,甚至有一些搞 AI 应用的人也讲不太清楚。
(, 下载次数: 0)


那我借着这篇文章,用相对通俗易懂的语言帮助大家更好地理解这个概念。
大家不用担心,不管你是程序员、老师还是销售,这篇文章你都能看懂,看完之后都能对智能体有进一步的了解。
通俗讲解

(, 下载次数: 0)


台湾大学李宏毅教授的《生成式 AI 时代的机器学习(2025)》第二讲中就提到:
AI Agent 没有标准的定义。
以前我们使用大模型的主要方式就是打开对话框,提出问题,它给出回答。
AI Agent (AI 智能体)则是我们提出目标,AI 自己去思考规划、调用各种工具,最终帮我们达成这个目标。
(, 下载次数: 0)


比如说你让 AI 智能体去帮你在购物网站上挑选某个商品,那么 AI 智能体会打开浏览器,执行各种搜索,然后挑选出符合你要求的商品。
能力层面

从能力层面来讲,他并不关心智能体内部实现,更关心“AI 完成任务的占比”。


如果是从能力层面来讲的话:
ChatGPT 就相当于我们直接在对话框里问问题,然后它给一些建议,我们需要自己再回去处理工作。
那么像 Cursor、Claude Code 这种就是人类和 AI 一起协作,工作量基本相当。
而 Agent 的话,其实需要 AI 完成更多工作,人类主要负责设定目标、提供资源、监督结果。Agent 需要自主完成任务拆解、工具选择、进度控制,实现后自主结束工作。
结构层面

(, 下载次数: 0)


在复旦大学 NLP团队的一篇智能体综述《The Rise and Potential of Large Language Model
Based Agents: A Survey》中,主要提到大语言模型驱动的智能体的概念。
其中提到基于大语言模型的智能体,主要包括三个组件:一个是大脑,一个是感知,一个是行动。
它可以感知环境,获取输入可能是文本、图片、视频、音频等。它有“大脑”可以进行规划、存储,也能执行各种行动,包括输出文本、调用工具、操作机械臂等。
(, 下载次数: 0)


在 Google 的智能体白皮书中提到智能体,主要包括编排、模型和工具。
在编排中主要包括配置指令、目标,以及 memory(记忆),以及推理和规划。
模型的话通常指现在的大语言模型。
工具的话可能是浏览器,可能是搜索引擎,可能是计算器等。
(, 下载次数: 0)


比如说用户说想让智能体帮订一个机票:





欢迎光临 AI创想 (https://llms-ai.com/) Powered by Discuz! X3.4