
AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。
领域适应(Domain Adaptation)是与机器学习和迁移学习相关的领域。当我们的目标是从源数据分布中学习在不同目标数据分布上运行良好的模型时,就会出现这种情况。例如,常见垃圾邮件过滤问题的任务之一就是使一个用户的模型适应接收截然不同的电子邮件的新用户。领域适应性也已被证明对学习不相关的资源是有益的。
根据目标域和源域的不同类型,领域自适应问题有四类不同的场景:无监督的,有监督的,异构分布和多个源域问题。通过在不同阶段进行领域自适应,研究者提出了三种不同的领域自适应方法:1)样本自适应,对源域样本进行加权重采样,从而逼近目标域的分布。2)特征层面自适应,将源域和目标域投影到公共特征子空间。3)模型层面自适应,对源域误差函数进行修改,考虑目标域的误差。
根据AMiner-IJCAI 2020词云图,我们发现表征学习、图神经网络、深度强化学习、深度神经网络、领域适应等都是今年比较火的Topic,受到了很多人的关注。今天我们给大家分享的是IJCAI 2020五篇必读的领域适应(Domain Adaptation)相关论文。

1.论文名称:Towards Accurate and Robust Domain Adaptation under Noisy Environments
论文链接:https://www.aminer.cn/pub/5ea8009091e0111d387ee7e2?conf=ijcai2020
简介:在非平稳环境中,学习机通常会遇到领域适应方案,在该方案中,数据分布确实会随着时间而变化。先前的领域适应工作在理论和实践上都取得了巨大的成功。但是,它们在源环境中示例的标签和功能遭到破坏的嘈杂环境中始终会失去鲁棒性。在本文中,我们报告了我们为实现精确的噪声稳健域自适应所做的尝试。我们首先进行理论分析,揭示有害噪声如何影响无监督域自适应。为了消除标签噪声的影响,我们建议进行离线课程学习,以最大程度地减少新定义的经验来源风险。为了减少特征噪声的影响,我们提出了一种基于代理分布的边距差异。我们将我们的方法无缝地转换成一个对抗网络,对它们执行有效的联合优化,从而成功地减轻了数据损坏和分布转移带来的负面影响。一系列的经验研究表明,我们的算法明显优于最新技术,在嘈杂环境下,某些领域自适应任务的准确性提高了10%以上。

2.论文名称:Domain Adaptation for Semantic Parsing
论文链接:https://www.aminer.cn/pub/5ef3247f91e0110c353dab9e?conf=ijcai2020
简介:最近,语义解析在社区中引起了很多关注。尽管许多神经建模工作已经极大地改善了性能,但是它仍然遭受数据稀缺问题的困扰。在本文中,我们提出了一种用于域适应的新型语义解析器,与源域相比,目标域中的注释数据要少得多。我们的语义解析器受益于两阶段的粗到精框架,因此可以为这两个阶段提供不同而准确的处理,即分别专注于领域不变信息和领域特定信息。在粗略阶段,我们新颖的域区分组件和对域相关性的关注鼓励模型学习可转移的域一般结构。在精细阶段,该模型被引导以专注于领域相关的细节。在基准数据集上进行的实验表明,我们的方法始终优于几种流行的领域自适应策略。此外,我们证明了我们的模型可以很好地利用有限的目标数据来捕获源域和目标域之间的差异,即使目标域的训练实例少得多。

3.论文名称:Bridging Cross-Tasks Gap for Cognitive Assessment via Fine-Grained Domain Adaptation
论文链接:https://www.aminer.cn/pub/5ef96b048806af6ef2772228?conf=ijcai2020
简介:将病理认知下降与正常衰老的预期下降区分开是老年人护理和健康监测的重要研究课题。但是,大多数认知评估方法仅在训练集和测试集的数据分布一致时才起作用。使现有的认知评估模型适应新的认知评估任务中的数据是一项重大挑战。在本文中,我们提出了一种新的领域自适应方法,即细粒度自适应随机森林(FAT),以弥合数据分布变化时的认知评估差距。FAT由两个基本部分组成:1)基于信息增益的模型评估策略(IGME)和2)域适应树增长机制(DATG)。IGME用于评估每棵单独的树,DATG用于将源模型转移到目标域。为了评估FAT的性能,我们在真实的临床环境中进行了实验。实验结果表明,与其他最新方法相比,FAT显着更准确,更有效。

4.论文名称:Joint Partial Optimal Transport for Open Set Domain Adaptation
论文链接:https://www.aminer.cn/pub/5ef96b048806af6ef2772132?conf=ijcai2020
简介:域调整(DA)通过利用来自源域的标记数据适应未标记的目标域,在学习良好的分类器方面取得了巨大的成功。但是,在一般情况下,当目标域包含源域中从未观察到的类时,即在开放集域适配(OSDA)中,由于多余的未知类的干扰,现有的DA方法无法正常工作。这是一个更具挑战性的问题,因为由于未知类和已知类之间的不匹配,它很容易导致负迁移。当特征空间中的目标域未知样本分布在从标记源域学习的决策边界附近时,现有研究容易分类错误。为了克服这个问题,我们提出了联合部分最优运输(JPOT),不仅充分利用了标记源域的信息,而且充分利用了目标域中未知类的判别式表示。所提出的联合判别原型紧实度损失不仅可以实现类内紧实度和类间可分离性,而且可以通过反向传播来估计未知类的均值和方差,由于对结构的盲目性,这对于以前的方法仍然难以解决。未知的班级。据我们所知,这是OSDA的第一个最佳传输模型。大量实验表明,我们提出的模型可以大大提高标准DA数据集上开放集域自适应的性能。

5.论文名称:Metric Learning in Optimal Transport for Domain Adaptation
论文链接:https://www.aminer.cn/pub/5ef96b048806af6ef277214c?conf=ijcai2020
简介:域适应旨在受益于从源分布中提取的标记数据集,以从不同但相关的目标分布中生成的示例中学习模型。在两个源域和目标域之间创建域不变表示是最广泛使用的技术。一种简单而健壮的执行此任务的方法包括(i)用两个子空间分别表示各自的特征向量来表示两个域,以及(ii)寻找对齐它们的映射函数。在本文中,我们建议使用最佳运输(OT)及其相关的Wassertein距离来执行此对齐。尽管在域自适应中使用OT的想法并不新颖,但本文的原始贡献是双重的:(i)我们推导了涉及多个Wassertein距离的目标误差的推广界。这促使我们优化OT的地面指标以降低目标风险;(ii)从理论分析出发,我们设计了一种算法(MLOT),该算法可优化马哈拉诺比斯距离,从而得出适应性更好的运输计划。大量的实验证明了这种原始方法的有效性。


阅读原文,直达“IJCAI2020”会议专题,了解更多会议论文!

