探索群体智能的奥秘,研究多个自主智能体如何在协作与竞争中涌现出超越个体的集体智慧
多智能体系统研究的核心问题与理论基础
观察智能体如何在环境中学习协作策略
多智能体强化学习的主流方法
多智能体深度确定性策略梯度,为每个智能体学习集中式训练、分散式执行的策略
基于值函数分解的多智能体Q学习,将联合动作值函数分解为个体值函数的单调组合
通信网络架构,让智能体通过学习通道交换信息,实现隐式协调与协作
多智能体事后经验回放,解决多智能体场景下的信用分配问题
多智能体技术的实际应用领域
多路口协同信号控制,车辆路径规划,缓解城市拥堵
AGV路径规划,货架搬运协调,智能分拣系统
分布式能源调度,负载均衡,微电网协同