IJCAI全称国际人工智能联合会议,是人工智能领域中最主要的学术会议之一。IJCAI2021由于疫情影响,也将于线上举行,本次会议在4204篇投稿论文中,有587篇论文被录取,论文接收率低至13.9%。
AMiner通过AI技术,对IJCAI2021收录的会议论文进行了分类整理,欢迎下载收藏!
AMiner-IJCAI 2021:https://www.aminer.cn/conf/ijcai2021
1.论文名称:Reinforcement Learning for Sparse-Reward Object-Interaction Tasks in First-person Simulated 3D Environments
论文链接:https://www.aminer.cn/pub/5f9bd99491e011dcf482d815

通过LOAD,我们证明了学习注意对象模型与注意对象为中心的策略可以在高保真、3D、对象交互领域实现高效的样本学习,而无需访问专家演示或基本事实对象信息。与强的无监督对象表示学习基线相比,注意对象模型能够最好地捕获真实的对象信息。
2.论文名称:Mean Field Games Flock! The Reinforcement Learning Way
论文链接:https://www.aminer.cn/pub/60a3bb7b91e01115219ffbd4

我们提出了一种方法:让大量代理来学习一项大种群动物的自然行为——群集。这个问题引起了很多人的兴趣,同时也需要许多结构性的假设,而且只有在小维度上才能处理。我们将此问题称为平均场对策(MFG),其中的每一个体都根据种群行为选择其加速度。结合深度强化学习(RL)和规范化流(NF),我们得到了一个易于处理的解决方案。
3.论文名称:Boosting Offline Reinforcement Learning with Residual Generative Modeling
论文链接:https://www.aminer.cn/pub/60d3d23e91e0112ca5d1856e

本文对生成式建模的误差进行了分析。我们提出了一种残差生成模型AQL来减少离线RL的策略逼近误差。我们证明了此方法可以学习更准确的策略逼近在不同的基准数据集。此外,我们还证明了,在多人在线竞技游戏《王者荣耀》中,这种离线RL方法可以在复杂控制任务中学习更多具有竞争力的AI agent。
4.论文名称:Efficient PAC Reinforcement Learning in Regular Decision Processes
论文链接:https://www.aminer.cn/pub/60a2447991e0115ec77b9d24

我们在常规决策过程中研究强化学习。我们证明了一个接近最优的策略可以在描述基本决策过程的一组参数的多项式时间内被PAC学习。我们认为可识别的参数集是最小的,它合理地捕捉了常规决策过程的困难。
5.论文名称:BACKDOORL: Backdoor Attack against Competitive Reinforcement Learning
论文链接:https://www.aminer.cn/pub/60912d2191e01105f877fba7

我们将backdoor攻击迁移到包含多个代理的更复杂的RL系统中,并探索在不直接操纵代理的观察结果的情况下触发backdoor的可能性。我们证明了在双人竞争的RL系统中,对手代理可以用自己的动作触发受害者代理的backdoor。我们在四个竞争环境中对BACKDOORL进行原型和评估,结果显示,当backdoor被激活时,受害者的胜率比未被激活时下降了17%到37%。

阅读原文,了解更多论文!

