多智能体系统研究

探索群体智能的奥秘,研究多个自主智能体如何在协作与竞争中涌现出超越个体的集体智慧

实时仿真 核心算法
🤖
100+
智能体规模
🎯
MADDPG
核心算法
📊
5
仿真环境
🏆
NeurIPS
顶会发表

核心概念

多智能体系统研究的核心问题与理论基础

协作博弈
群体智能
涌现行为
通信学习

🎮 实时多智能体仿真

观察智能体如何在环境中学习协作策略

探索者 收集者 资源
20
0.01
0.7

核心算法

多智能体强化学习的主流方法

🎯
MADDPG

多智能体深度确定性策略梯度,为每个智能体学习集中式训练、分散式执行的策略

θJ ≈ E[∇θπ(a|o) · ∇aQ(s,a)|a=π(o)]
Actor-Critic 集中训练 分散执行
🌟
QMIX

基于值函数分解的多智能体Q学习,将联合动作值函数分解为个体值函数的单调组合

Qtot(τ,u) = f(Q11,u1), ..., Qnn,un))
值分解 单调性 CTDE
🗣️
CommNet

通信网络架构,让智能体通过学习通道交换信息,实现隐式协调与协作

hi = f(oi, mean({hj : j ≠ i}))
通信学习 信息聚合 协调机制
🎲
MA-POCA

多智能体事后经验回放,解决多智能体场景下的信用分配问题

i = r + γ maxa' Q(s', a') - Q(s, a)
信用分配 经验回放 好奇心驱动

应用场景

多智能体技术的实际应用领域

🚦

智能交通调度

多路口协同信号控制,车辆路径规划,缓解城市拥堵

了解详情 →
🏭

仓储机器人协作

AGV路径规划,货架搬运协调,智能分拣系统

了解详情 →

智能电网管理

分布式能源调度,负载均衡,微电网协同

了解详情 →

研究影响力

📄
18
发表论文
💻
3
开源项目
🏆
5
竞赛获奖
🤝
8
合作伙伴

📚 代表性论文

NeurIPS 2024
Emergent Communication Protocols in Multi-Agent Reinforcement Learning
Chen Y., Wang L., Zhang H., et al.
被引 45 次 🏆 最佳论文提名
ICML 2024
Scalable Coordination in Large-Scale Multi-Agent Systems via Graph Neural Networks
Li M., Liu X., Chen Y.
被引 32 次 ⭐ Spotlight
JAAMAS
Credit Assignment in Cooperative Multi-Agent Reinforcement Learning: A Survey
Zhang H., Wang S., Chen Y., et al.
被引 128 次 📊 领域综述