开启左侧

三、智能体强化学习——多智能体强化学习 (MARL) 及人机协作

[复制链接]
admin 发表于 2025-9-7 23:20:13 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
    多智能体强化学习问题定义主流多智能体算法人机协作指挥决策的关键技术
多智能体间的协同/对抗学习方法,还包括如何将“人在环”(Human-in-the-Loop)纳入系统,以实现人机协作式决策。



<hr>3.1 多智能体强化学习问题定义

3.1.1 多智能体协同与对抗场景

在单智能体强化学习中,环境通常由一个智能体与外部世界构成。而在多智能体环境中,存在多个智能体 (agents),它们相互影响同时进行学习和决策,因此会出现博弈协同等复杂行为。
    多智能体协同 (Cooperative)
      多个智能体有共同目标或部分重叠的目标,需要协同分工、共同完成任务;例如:多机器人协同搬运、多无人机协同搜索等。
    多智能体对抗 (Competitive)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注0

粉丝0

帖子147

发布主题
阅读排行更多+

Powered by Discuz! X3.4© 2001-2013 Discuz Team.( 京ICP备17022993号-3 )