AI创想

标题: 深度解析 | 多智能体系统的工作流程、基础设施和挑战 [打印本页]

作者: admin    时间: 2025-9-7 23:22
标题: 深度解析 | 多智能体系统的工作流程、基础设施和挑战


基于LLM的多智能体(multi-agent)系统已被提出作为利用集体智慧的关键途径,同时保留各个智能体的专业特性,从而朝着更复杂的自主智能系统迈进。
多个具有不同身份的专业化智能体通过沟通和协作来实现任务目标。这一过程强调了在交互环境中,智能体间通信的重要性,利用知识和经验进行推理以生成决策,以及自我反思(反思其行动和行为以实现个人成长)的进化。
背景

单智能体

单智能体系统由一个基于大型语言模型的智能智能体组成,该智能体能够独立感知其环境并做出决策。设计单智能体系统的目的是执行特定任务,从简单自动化到复杂决策制定不等。单智能体系统的核心在于智能体的个体特征、感知能力和自我行动能力。从个体特征的角度来看,单个智能体被赋予了一组独特的属性和能力,这些属性和能力定义了其在环境中的行为模式和角色。
单智能体系统的显著优势在于其专注性和效率。由于系统资源和计算能力集中在单个智能体上,这些系统能够迅速响应和执行特定任务。
多智能体

尽管单智能体系统在特定任务中表现出色,但在处理需要广泛合作和集体智能的复杂问题时可能会遇到限制。这就是多智能体系统(multi-agent systems, MAS)发挥作用的地方。MAS是由多个相互作用的智能体组成的复杂系统,能够模拟现实世界中的社会互动和团队合作,通过分散的决策过程和信息共享提高整体适应性和效率。
MAS的核心优势在于其分布式决策和问题解决能力。MAS提供了一种现代方法来解决分布式人工智能问题。在MAS中,每个智能体都拥有一定程度的自主性,能够独立感知环境并做出决策。它们还可以通过模拟真实世界的协作模式(如合作、竞争和层次组织)与其他智能体进行交互,从而提高整体协作效率。
基于LLM的多智能体工作



配置

实例化具有个性化风格的独立智能实体,类似于一个人,从而使他们能够完成特定的子任务。例如,在模拟学校运营的背景下,合适的角色包括教师、学生和学校校长。
配置文件上下文

根据具体情境或用户规格,智能体配置文件可能包含不同类型和内容的信息。作为智能体的基本内在特征,个人资料通常包括基本信息,如姓名、年龄、性别和职业。
生成策略

选择用于描述智能体的信息主要由特定的应用场景决定,从而指导个人资料生成的轨迹。鉴于场景建模与智能体生成之间的复杂关系,现有文献通常采用以下三种策略:
知觉

信息获取对于作为独立智能实体的智能体至关重要,使其能够感知外部环境条件及其内部状态。然后通过感知模块将这些信息转换为中间表示形式,进而决定智能体的自主决策结果和行为反应。
信息来源

根据智能体互动或通信对象的性质,现有文献将智能体感知信息的来源分为以下三种类型:
消息类型

自我行动

自我行动代表了智能体的一个关键机制,作为一个独立实体,自主作出决策并执行对其在互动环境中生存和进化必要的行动。
记忆

记忆模块作为智能体的存储和回忆单元,在使其能够利用现有的认知和经验知识以适应与环境或其他智能体的动态互动中起着关键作用。通过这一过程,智能体积累新的见解和经验,这些可以通过更新内存进一步促进其认知能力和智能。内存可视化的核心功能在图2中进行了说明。


内存检索(Retrieval)
在智能体领域,有效的信息检索对于促进复杂环境或其他智能体之间的动态互动至关重要,检索到的信息总是被视为重要的经验参考。内存检索旨在通过从智能体的记忆中提取与当前情况相关的有价值信息来提高决策的准确性。这些信息包括环境感知、历史互动记录、经验数据和外部知识等各种元素。
记忆存储(Storage)
将关键信息存储在记忆中构成了智能体依赖的基础知识库,以便在复杂环境中感知和行动,从而提高它们的效率和理性。记忆存储的目的是归档智能体在互动过程中感知到的信息和学到的经验。通常,这个过程涉及将自然语言文本写入记忆,这包括选择适当的存储位置和管理信息的替换。这种系统化的记忆存储方法确保最相关的数据易于获取,促进智能体做出明智的决策和适应性响应。
记忆映射(Reflection)
记忆映射是一种过程,通过该过程,智能体基于感知到的信息和从历史互动中学习到的经验(存储在记忆中)进行自我改进。这个过程模拟了人类总结、精炼和反思现有知识的做法,目的是增强智能体适应新环境和任务的能力。
知识利用



行动

行动代表交互式环境内智能体的有形行为结果,从而有效地改变环境并对智能体间的互动产生重大影响。这些行动通常由一系列配置文件、记忆和互动上下文(包括智能体与智能体、智能体与环境以及智能体与人类的互动)共同决定。位于最下游位置的行动,根据应用场景的不同而变化繁多。可以从两个角度来阐明行动机制:
相互交互

相互交互涵盖了智能体之间的信息交换和行动协调,这对于提升多智能体系统内的集体智慧至关重要。
消息传递

消息传递是促进智能体之间通信和协作的关键组成部分,涉及智能体之间的信息交换。消息通常以文本形式记录和传输,尽管一些工作还结合了视觉和音频等多模态信息。消息内容根据任务分配和互动通信场景动态变化,通常包括历史状态信息和当前状态信息以及其他智能体的通信消息。
交互结构

交互结构描述了多智能体系统内的通信框架,通常基于消息内容进行组织和安排,从而为智能体分配不同的角色和责任。该结构本质上反映了智能体之间的关系以及消息传递的可能方法和路径。根据消息传递的模式和智能体间通信的关系,交互结构可以分为四种类型:层次型、分散型、集中型和共享内存型。每种类型的结构都定义了特定的信息交换动态和协议,影响多智能体系统的整体效率和连贯性。
交互场景

在多智能体系统中,智能体之间的交互场景至关重要,因为它们不仅决定了智能体的行为模式,还影响系统的整体效率和有效性。


进化

与人类不断通过与环境和其他人的互动来精炼认知能力和获取知识类似,智能体的进化涉及对其决策和行动的持续反思,以动态更新其知识。基于现有经验和在互动过程中收到的反馈,如图6所示。通过采用进化机制,智能体可以不断精炼或修正他们当前的理解,从而加深对已知任务的熟练度,并扩大对未知任务的成功探索。


进化源

在互动过程中收到的反馈是智能体实现进化的不可或缺的参考信息。这种反馈包括智能体决策和行动的结果及影响,指导它们进行内省,从而动态提升它们适应复杂环境或任务的能力。以往的工作主要以文本形式捕捉和传达反馈。根据智能体接收反馈的来源,它可以被归类为三种不同的类型。每个来源提供独特的见解,有助于智能体的自我反思和持续改进过程。
进化方法

进化方法涵盖了多种旨在通过自我改进和从与环境互动中学习来增强智能体的能力和适应性的技术。这些方法对于开发能够自主完善策略和行为以实现跨多样任务和场景更好性能的智能系统至关重要。
智能体调整

应用



问题解决

LLMs通过利用其在自然语言理解和其他应用方面的先进能力,正在改变各个领域的问题解决方式。这些模型擅长分解复杂任务,提供解决方案,并促进虚拟智能体之间的高效协作。
世界模拟

LLM智能体能够理解并生成连贯、语义丰富的文本,从而模拟人类行为和互动。该功能使大型语言模型智能体能够在模拟世界、与环境和其他智能体互动的过程中扮演各种角色,从而构建具有一定真实度的虚拟世界。在世界模拟中,大型语言模型智能体可以被赋予不同的任务和属性,如扮演游戏中的角色、模拟社会中的行为以及进行经济决策分析,从而促进各个领域中的模拟和研究。
讨论

在快速发展的AI领域,由于通过协作和协调处理复杂任务的潜力,多智能体系统引起了广泛关注。然而,这些系统的实施和部署面临众多挑战。

内容来源:IF 实验室




欢迎光临 AI创想 (http://llms-ai.com/) Powered by Discuz! X3.4