本周精选了10篇数据挖掘领域的优秀论文,来自南开大学、新加坡国立大学、微软研究院等,主要包括基于会话的个人属性预测、Re4: 学会为多重兴趣的推荐而重新对比、重新参与、重新构建、TaxoExpan: 基于位置增强图形神经网络的自监督分类扩展等。
为了更方便地阅读,只整理了论文标题、作者、AI综述等,如果感兴趣可点击进入小程序详情页查看论文,PC端数据同步,每日新论文也可登录小程序查看。
论 文 合 集✦
1.Personal Attribute Prediction from Conversations了解详情
作者介绍:Yinan Liu, Hu Chen, Wei Shen
AI华同学综述(大模型驱动):基于语言模型的个性化决策支持向量机我们提出了一个框架,该框架基于一个先前训练的语言模型,该模型使用噪声可靠损失函数来预测用户的个人属性。我们提出了两种监督级别,即文档级别的监督和单词级别的监控。实验表明,我们的框架优于所有十二个基线,在nDCG和MRR方面取得了最好的性能。
2.Re4: Learning to Re-contrast, Re-attend, Re-construct for Multi-interest Recommendation了解详情
作者介绍:Shengyu Zhang, Lingxiao Yang, Dong Yao, Yujie Lu, Fuli Feng, Zhou Zhao, Tat-seng Chua, Fei Wu
AI华同学综述(大模型驱动):本文描述了ComiRec的新前向后多样性范式,并在三个实际数据集上进行了广泛的实验。经验研究证实,Re4有助于学习学习具有不同的多样性和有效多样性的表示。我们提出了一种新的多样多兴趣范式Re4,并将其应用于三个现实数据集。
3.Solving Learn-to-Race Autonomous Racing Challenge by Planning in Latent Space了解详情
作者介绍:Shivansh Beohar, Fabian Heinrich, Rahul Kala, Helge Ritter, Andrew Melnik
AI华同学综述(大模型驱动):学习比赛自动驾驶挑战是开放的,由一个团队参与。该挑战包括单个和多照相机赛道。我们的联合团队在单个摄像头赛道中名列榜首。代理需要在以前已知的F1风格赛道上最小程度通过。
4.An Invertible Graph Diffusion Neural Network for Source Localization了解详情
作者介绍:Junxiang Wang, Junji Jiang, Liang Zhao
AI华同学综述(大模型驱动):本文提出了一种用于图传播中源位置的非对称上下文无关图传播模型的泛化框架。我们提出了一种新的误差补偿机制,学习将推断的来源映射到合适的区域。我们还提出了一种线性化技术,以增强该技术的效率。
5.TaxoExpan: Self-supervised Taxonomy Expansion with Position-Enhanced Graph Neural Network了解详情
作者介绍:Shen Jiaming, Shen Zhihong, Xiong Chenyan, Wang Chi, Wang Kuansan, Han Jiawei
AI华同学综述(大模型驱动):我们研究了如何将现有的分类器扩展为一个新的、可扩展的框架。我们提出了一个名为《TaxoExpan》的自我监督框架,该框架自动从现有分类器中生成一组训练数据。使用这些训练数据,分类器学习了一个模型来预测查询概念是否是锚定概念的直接先行词。我们开发了两项创新的技术:(1)一个增强的图形神经网络,该网络编码了现有分类器的局部结构,以及(2)一个噪声可控的训练范式,该范式允许学习模型不敏感到标签噪声。
6.Structural Deep Clustering Network了解详情
作者介绍:Bo Deyu, Wang Xiao, Shi Chuan, Zhu Meiqi, Lu Emiao, Cui Peng
AI华同学综述(大模型驱动):结构化深层聚类网络我们提出了一种结构化深度聚类网,该网将结构化信息整合到深层神经网络中,并指导整个模型的更新。特别是,我们设计了一个交付运营商,该运营商将学习到的结构化表示传输到相应的GCN片段,并使用双向监督机制来统一这些两个不同高度神经网络的结构。通过理论分析,我们证明了我们的提倡模型可以 consistently优于最先进的技术。
7.Soft-mask: Adaptive Substructure Extractions for Graph Neural Networks了解详情
作者介绍:Mingqi Yang, Yanming Shen, Heng Qi, Baocai Yin
AI华同学综述(大模型驱动):图形语言模型的隐马尔可夫结构学习本文提出了一种图形字符串的学习方法,其中隐马克结构是通过隐藏在原始图的子图中训练的。为了更好地捕捉任务相关结构或层次结构,我们设计了一个软封闭GNN layer,以利用隐藏机制来捕捉目标的子语料库。软封底被定义为动态空间,以保持差异性和表征不同组件之间的权重。与现有的副图或层次表示学习方法和图集提取操作不同,软封袋GNN层的灵活性比原始字符或层次模型的灵敏度要低得多。在公开图 benchmark中,广泛的实验表明,隐马袋机制会产生改进。
8.Plumber: A Modular Framework to Create Information Extraction Pipelines了解详情
作者介绍:Mohamad Yaser Jaradeh, Kuldeep Singh, Markus Stocker, Sören Auer
AI华同学综述(大模型驱动):在本文中,我们提出了钢构,这是第一个允许用户从社区创建的工具库中自动创建适当的IE管道的框架。我们的框架提供了一个互动的媒介来调整管道,并执行IE任务。在不同使用场景中,视频展示了该框架在不同应用场景中的工作。
9.Conspiracy Brokers: Understanding the Monetization of YouTube Conspiracy Theories了解详情
作者介绍:Cameron Ballard, Ian Goldstein, Pulak Mehta, Genesis Smothers, Kejsi Take, Victoria Zhong, Rachel Greenstadt, Tobias Lauinger, Damon McCoy
AI华同学综述(大模型驱动):在研究阴谋理论的最新进展下,YouTube已经成为人们上传和讨论最受欢迎的网站之一。之前的工作已经将YouTube定义为人们上演和讨论不同理论的网站。在本文中,我们提出了一个分析阴谋论者YouTube创作者的货币化方法和可能针对该内容的 advertise者。我们将广告分类为商业类别,并将它们与阴谋和主流内容之间的相对频率进行比较。此外,我们还发现阴谋视频的潜在诱饵广告比主流视频的诱饵视频要频繁。
10.Translating Place-Related Questions to GeoSPARQL Queries了解详情
作者介绍:Ehsan Hamzei, Martin Tomko, Stephan Winter
AI华同学综述(大模型驱动):本文首先提出了YAGO2geo的地理信息增强版本,然后提出了一种从逻辑表示中生成逻辑解析的新方法。然后,我们使用动态模板方法将这些问题转换为逻辑的表示,这是一种理论上基于空间信息的概率推理。我们报告了进一步的改进,并对现有方法进行了评估。我们使用GIS Gold标准数据集进行了测试,并报告了巨大的改进。
编辑:赵俊杰
赵俊杰,香港科技大学广州校区Mphil,导师为熊辉教授,主要研究领域为数据挖掘、自然语言处理、商业智能等。本科期间以第一作者、通讯作者在SCI,EI,中文核心期刊发表论文数篇,担任国际顶级会议ACM SIGKDD2022 审稿人。
学者主页:
https://www.aminer.cn/profile/63101e1bf5d67833f7a56603
如果想要获取更多数据挖掘的内容,欢迎使用AMiner订阅推荐系统。
只需两步即可完成订阅推荐!
输入“Date Mining”,即可获得与数据挖掘相关的推荐内容,快去试试吧!
end
点击阅读原文,直达AMinerRec系统
快来定制你的科研动态吧!

