大数跨境
0
0

浙江大学与南栖仙策推出SMAC-HARD,助力MARL算法评估

浙江大学与南栖仙策推出SMAC-HARD,助力MARL算法评估 科情智库
2025-02-11
0

科情智库


近期,浙江大学与南栖仙策联合推出了基于SMAC模拟环境的SMAC-HARD,旨在提升多智能体强化学习(MARL)算法的训练鲁棒性和评估全面性。SMAC-HARD支持可编辑和随机化的对手策略,以及MARL自博弈接口,使智能体能够适应多样化的对手行为,从而提高模型的稳定性。用户可以通过设置参数,选择自博弈模式或决策树模式,灵活调整对手的策略生成方式。同时,SMAC-HARD还提供了黑盒测试模式,智能体在训练过程中仅与默认对手策略或自博弈模型进行交互,但在测试时与环境提供的脚本进行对抗,用于评估算法的策略覆盖性和迁移能力。此外,SMAC-HARD修正了原SMAC环境中奖励结算的错误,避免智能体陷入最大化奖励但胜率较低的次优解。研究结果表明,现有的MARL算法在这一环境中面临更大挑战,难以保持高胜率,强调了在多样化对手策略下提升算法泛化能力的重要性。


来源:领域中心供稿


推荐阅读 >

欧盟国际科技合作管理与服务体系特点及启示

产业组织理论视角下基于大数据的区域协同创新评价研究

2025年科技政策与战略情报高级分析师培训班通知

【声明】内容源于网络
0
0
科情智库
宣传科技信息资源及科技情报研究成果,关注产业最新动态、发展热点和重大变革,为科技创新提供新媒体渠道。
内容 2085
粉丝 0
科情智库 宣传科技信息资源及科技情报研究成果,关注产业最新动态、发展热点和重大变革,为科技创新提供新媒体渠道。
总阅读251
粉丝0
内容2.1k