多智能体系统 - 尘渊文化

核心概念

多智能体系统研究的核心问题与理论基础

协作博弈

群体智能

涌现行为

通信学习

🎮 实时多智能体仿真

观察智能体如何在环境中学习协作策略

探索者收集者资源

智能体数量 20

学习速率 0.01

协作系数 0.7

核心算法

多智能体强化学习的主流方法

🎯

MADDPG

多智能体深度确定性策略梯度，为每个智能体学习集中式训练、分散式执行的策略

∇_θJ ≈ E[∇_θπ(a|o) · ∇_aQ(s,a)|_a=π(o)]

Actor-Critic 集中训练分散执行

🌟

QMIX

基于值函数分解的多智能体Q学习，将联合动作值函数分解为个体值函数的单调组合

Q_tot(τ,u) = f(Q₁(τ₁,u₁), ..., Q_n(τ_n,u_n))

值分解单调性 CTDE

🗣️

CommNet

通信网络架构，让智能体通过学习通道交换信息，实现隐式协调与协作

h_i = f(o_i, mean({h_j : j ≠ i}))

通信学习信息聚合协调机制

🎲

MA-POCA

多智能体事后经验回放，解决多智能体场景下的信用分配问题

r̃_i = r + γ max_a' Q(s', a') - Q(s, a)

信用分配经验回放好奇心驱动

应用场景

多智能体技术的实际应用领域

🚦

智能交通调度

多路口协同信号控制，车辆路径规划，缓解城市拥堵

了解详情 →

🏭

仓储机器人协作

AGV路径规划，货架搬运协调，智能分拣系统

了解详情 →

⚡

智能电网管理

分布式能源调度，负载均衡，微电网协同

了解详情 →

研究影响力

📄

发表论文

💻

开源项目

🏆

竞赛获奖

🤝

合作伙伴

📚 代表性论文

NeurIPS 2024

Emergent Communication Protocols in Multi-Agent Reinforcement Learning

Chen Y., Wang L., Zhang H., et al.

被引 45 次 🏆 最佳论文提名

ICML 2024

Scalable Coordination in Large-Scale Multi-Agent Systems via Graph Neural Networks

Li M., Liu X., Chen Y.

被引 32 次 ⭐ Spotlight

JAAMAS

Credit Assignment in Cooperative Multi-Agent Reinforcement Learning: A Survey

Zhang H., Wang S., Chen Y., et al.

被引 128 次 📊 领域综述