终于有人把“智能体”的概念给我讲明白了！

创想小编 · 发表于 2026-3-24 11:58:30

作者：悟鸣
前段时间团队的实习生跑来问我，能不能给他讲一讲什么是智能体？
她说她看了很多资料，但是还是有些模糊。
也有一些粉丝会在群里问过类似的问题。
还有我接触到的一些大学老师，甚至有一些搞 AI 应用的人也讲不太清楚。

那我借着这篇文章，用相对通俗易懂的语言帮助大家更好地理解这个概念。
大家不用担心，不管你是程序员、老师还是销售，这篇文章你都能看懂，看完之后都能对智能体有进一步的了解。
通俗讲解

台湾大学李宏毅教授的《生成式 AI 时代的机器学习（2025）》第二讲中就提到：
AI Agent 没有标准的定义。
以前我们使用大模型的主要方式就是打开对话框，提出问题，它给出回答。
AI Agent （AI 智能体）则是我们提出目标，AI 自己去思考规划、调用各种工具，最终帮我们达成这个目标。

比如说你让 AI 智能体去帮你在购物网站上挑选某个商品，那么 AI 智能体会打开浏览器，执行各种搜索，然后挑选出符合你要求的商品。
能力层面

从能力层面来讲，他并不关心智能体内部实现，更关心“AI 完成任务的占比”。

如果是从能力层面来讲的话：
ChatGPT 就相当于我们直接在对话框里问问题，然后它给一些建议，我们需要自己再回去处理工作。
那么像 Cursor、Claude Code 这种就是人类和 AI 一起协作，工作量基本相当。
而 Agent 的话，其实需要 AI 完成更多工作，人类主要负责设定目标、提供资源、监督结果。Agent 需要自主完成任务拆解、工具选择、进度控制，实现后自主结束工作。
结构层面

在复旦大学 NLP团队的一篇智能体综述《The Rise and Potential of Large Language Model
Based Agents: A Survey》中，主要提到大语言模型驱动的智能体的概念。
其中提到基于大语言模型的智能体，主要包括三个组件：一个是大脑，一个是感知，一个是行动。
它可以感知环境，获取输入可能是文本、图片、视频、音频等。它有“大脑”可以进行规划、存储，也能执行各种行动，包括输出文本、调用工具、操作机械臂等。