第五届“数据分析与知识发现”学术研讨会
第五届“数据分析与知识发现”学术研讨会将于2025年11月1-2日在广东东莞松山湖召开。本次会议由中国科学院文献情报中心与广东医科大学联合主办,广东省数智健康医疗工程技术研究中心和《数据分析与知识发现》编辑部联合承办。会议将邀请国内外知名学者、企业代表、优秀论文作者做精彩报告。欢迎相关领域的研究、实践和管理人员报名参会,参与交流。
会议详细信息将通过会议网站公布,报名参会请访问本次会议网站:https://dakd2025.scimeeting.cn/
会议主题
DAKD2025
“AI+场景”驱动的知识发现与智能决策
专家报告
DAKD2025
熊辉 教授
香港科技大学(广州)
报告题目:
下一代具身VLA的关键技术及应用
张晓林 研究员
上海科技大学;中国科学院文献情报中心
报告题目:
从AI+X到X+AI: 推进数据分析与知识发现研究的范式转变
周园春 研究员
中国科学院计算机网络信息中心
报告题目:
科学地平线(SciHorizon)——面向科学领域“数据+大模型”的评价平台
报告摘要:
近年来,人工智能技术的迅猛发展推动了科学研究范式的深刻变革,使得“AI赋能科学”成为快速发展的前沿领域。随着大模型在科学研究中的广泛应用,亟需建立科学、系统的评测方法来衡量起在科学领域的能力。为此,我们研发了国际首个面向人工智能赋能科学研究的评价平台-科学地平线(SciHorizon),围绕“大模型科学领域能力”和“AI-Ready科学数据质量”两个维度构建了综合评价体系。本报告重点介绍其中的大模型科学能力和AI-Ready科学数据质量评估方法,并呈现平台整体系统设计与实现。
李广建 教授
北京大学信息管理系
报告题目:
情报AI:范式创新与体系重塑
报告摘要:
随着AI技术特别是大语言模型(LLM)研究的深入和广泛应用,人工智能不再仅是工具层面的技术手段,而日益成为推动特定领域知识体系重构与问题求解机制转型的核心驱动力,它正以一种颠覆性的姿态,促使情报学在理论架构与方法体系上发生根本性变革,推动了情报学从流程自动化迈向机器智能和人类智慧相协同也即“智-脑”协同的新阶段。报告提出“情报AI”(AI for Intelligence/Information,简称AI4I)这一面向“智-脑”协同时代的情报新范式,从观念、业务、技术、数据、模式、治理六个方面对这种新范式进行解读,梳理这种新范式下情报研究与情报工作的内在逻辑变迁,以期为新范式下的情报理论体系与实践应用框架构建提供支撑。
张智雄 正高工
中国科学院文献情报中心
报告题目:
科技文献内容深度挖掘的思路、框架和方法
报告摘要:
科技文献是一种重要的科技基础能力,科技文献又是知识的载体,蕴含着重要的人类知识,在人工智能时代,更是AI4S的重要知识源泉。报告人在承担相关科研任务及科技文献内容深度挖掘实践基础之上,提出了科技文献内容深度挖掘的思路框架。报告人认为科技文献中很多重要细粒度知识内容是不能简单地通过计算机领域的信息抽取、知识图谱构建等方法就可完成的,并以研究问题、主要创新点、重要研究观点等细粒度知识内容的挖掘为例,报告了团队在科技文献细粒度知识内容挖掘上的思路及方案。
张岩 教授
北京大学智能学院
报告题目:
大语言模型当前的几个问题及思考
报告摘要:
自ChatGPT问世以来,各种各样的大语言模型不断涌现,在不同领域争奇斗艳,飞速迭代,可谓缤纷斑斓。这些大模型在发展中有何特点,为什么最近一年多不再拼参数了,大模型有没有推理能力,当前的架构和技术能否通往真正的AGI,大模型目前能干些什么,其典型能力是什么,局限又在哪里;对于这些问题,我们进行了观察和分析,做出了自己的思考。最后,我们给出了关于大语言模型的一些预测和期待。
沈志宏 正高工
中国科学院计算机网络信息中心
报告题目:
FAIR×FAIR:AI时代的科学数据共享与利用
报告摘要:
大数据与人工智能的融合正在重塑科研范式,也对科学数据的共享与利用提出前所未有的需求。本报告系统梳理了在线分析、机器学习、大模型训练/推理及AI智能体等典型场景对数据的新要求,在传统FAIR“四可”维度(可发现、可访问、可互操作、可重用)基础上,提出面向AI的For-AI-Ready(FAIR)扩展原则,并剖析实现这些原则的关键技术挑战与解决路径。最后,报告展望了FAIR×FAIR原则下的科学数据新生态,并介绍团队的相关探索与进展。
金博 教授
大连理工大学创新创业学院;广东医科大学生物医学工程学院
报告题目:
数智驱动的全球灾害预警与风险评估
报告摘要:
在全球气候变化和极端事件频发的背景下,全球自然灾害的发生频率和强度呈上升趋势,对人类生命财产安全和社会经济发展构成了严峻威胁。然而,传统的灾害预警与风险评估方法往往依赖于本地的历史统计数据和单一数据源,在全球适用性和实时性方面存在明显的局限性。近年来,数智技术的迅猛发展为灾害治理提供了全新的路径。通过融合全球气象与水文再分析数据、卫星观测数据及地球物理数据等多源异构数据,并结合人工智能、大模型和高性能计算技术,可以实现灾害的快速识别、精准预测与动态风险评估。为此,构建的数智驱动的灾害预警体系,能够在全球范围内实现对各类重大自然灾害(如地震、洪水、台风、森林火灾等)的实时监测与预警,从而显著提升风险研判与决策支持的科学性和前瞻性。此外,在长期风险评估方面,围绕洪水与森林火灾两种常见的自然灾害,进行针对性的灾害概率的长周期概率分析以及灾害驱动因素的可解释性分析。本成果不仅能够实现对全球各地区(尤其是欠发达地区)各类灾害的准确实时预警,还推动了灾害管理从单一灾种向多灾种综合治理的转变,从而为全球可持续发展与人类安全提供了有力的科技支撑。
牛奔 教授
深圳大学管理学院
报告题目:
群智驱动的医生高风险行为协同监管
Swarm Intelligence-Driven Collaborative Supervision of High-Risk Behaviors Among Healthcare Providers
报告摘要:
This report introduces a Swarm Intelligence-Driven Collaborative Supervision Scheme for Doctors' High-Risk Behaviors. The framework comprises three core models: 1. A multi-objective swarm intelligence-optimized supervision model for outpatient prescriptions 2. A two-phase inpatient supervision model integrating collaborative evolution and temporal pattern recognition 3. A regionally coordinated supervision mechanism based on interactive swarm optimization By deeply integrating swarm intelligence with machine learning algorithms, the scheme not only provides explainable and evidence-based identification of high-risk behaviors but also incorporates federated learning to establish a cross-regional collaborative supervision framework. This ensures "data localization with encrypted parameter exchange," aligning with the hierarchical structure of healthcare insurance systems to form a reliable technical framework for medical insurance supervision.
杜建 助理教授
北京大学健康医疗大数据国家研究院
报告题目:
因果知识图谱构建及其在重大慢病管理中的应用
报告摘要:
因果知识图谱(简称因果图)是指导观察性数据因果推断和增强健康决策可解释性的基石。针对目前构建因果图主要依靠人工阅读科学出版物,存在耗时、易错、不系统及因科学不确定性造成理解偏差等问题,本报告将介绍从知识图谱中自动生成因果图的新策略,尤其是基于大语言模型开展健康证据提取和因果强度评估的新方法。并在此基础上分享因果图在观察性研究因果建模变量选择、生命历程疾病风险链推理与早期预防策略制定中的应用。促进文献计量学、自然语言处理和临床流行病学的交叉研究,促进信息资源管理在健康管理中的创新应用。
贾韬 教授
重庆师范大学
报告题目:
Knowledge Independence Breeds Disruption but Limits Recognition
报告摘要:
Recombinant growth theory highlights the pivotal role of cumulative knowledge in driving innovation. Although interconnected knowledge facilitates smoother dissemination, its connection to scientific disruption remains poorly understood. Leveraging 53.8 million publications spanning six decades from the Web of Science, we examine the bibliography of each paper and quantify the degree to which the references therein are ``independent'' in the sense that they do not cite one another. We observe that papers built on independent knowledge have decreased over time. However, propensity score matching and regression analyses reveal that such papers are associated with greater scientific disruption, as those who cite them are less likely to cite their references. Moreover, a team's preference for independent knowledge amplifies its disruptive potential, regardless of team size, geographic distance, or collaboration freshness. Despite the disruptive nature, papers built on independent knowledge receive fewer citations and delayed recognition. Taken together, these findings fill a critical gap in our fundamental understanding of scientific innovation, revealing a universal law in peer recognition: Knowledge independence breeds disruption at the cost of impact.
夏锋 教授
澳大利亚皇家墨尔本理工大学(计算机学院)
报告题目:
Beyond Accuracy: Graph Learning for Anomaly Detection
报告摘要:
Anomalies are not just outliers; they are often the most meaningful signals in data, pointing to fraudulent behavior in financial systems, irregular dynamics in brain activity, or unexpected disruptions in urban networks. Detecting such anomalies, however, is notoriously difficult. The patterns are often subtle, the data noisy, and the relationships deeply entangled within complex, evolving structures. Graphs provide a natural way to capture these interdependencies, and graph learning offers a powerful toolkit for advancing anomaly detection. In this talk, I will discuss how graph learning enables us to move beyond accuracy toward anomaly detection that is interpretable, robust, and human-centered. I will highlight key challenges facing this field and showcase recent solutions to these challenges. I will conclude by outlining a roadmap for the future of graph learning for anomaly detection, where the focus shifts from mere accuracy to a broader vision of scalability, interpretability, causality, and fairness. By integrating these dimensions, we can transform anomalies from being treated as noise into valuable opportunities for scientific discovery, system reliability, and actionable insights.
章成志 教授
南京理工大学经济管理学院
报告题目:
融合人类与大语言模型知识的学术论文新颖性评价研究
报告摘要:
围绕学术论文新颖性自动化评价展开研究。首先指出传统基于专家判断与引文组合的方法存在知识局限与偏差,难以客观衡量研究创新。为此,提出融合人类专家知识与大语言模型(LLMs)知识的协同框架,通过从评审报告中提取新颖性相关语句、利用LLMs生成方法摘要,并引入稀疏注意力的文本引导融合模块,实现对论文方法新颖性的预测。以ICLR 2022开放评审数据进行实证,结果表明人机知识融合在学术论文新颖性评价中的有效性与可扩展性。
陈云伟 研究员
中国科学院成都文献情报中心
报告题目:
基于技术-应用二模网络演化分析的颠覆性技术识别方法
报告摘要:
从颠覆性技术跨领域和非常规应用的这一特点出发,本研究基于专利数据,创新性地从应用扩散与演化的视角构建了一种技术颠覆性强度度量方法,为颠覆性技术识别提供一种新的客观合理的方法思路。首先从专利文本中抽取关键的技术主题及其应用场景,确定目标领域不同技术与应用场景之间的匹配关系。其次选取这些技术作为候选对象,构建一个以技术和应用为节点的动态二模网络模型,用于追踪各技术在不同应用领域的演变轨迹。而后,综合技术的应用演化特征来评估技术颠覆性强度,包括技术新颖性、增长性,和应用广泛性、创新性、突破性、替代性等方面。最后,以仿生领域为例进行实证研究,验证了所提方法的有效性。
祝忠明 研究员
兰州大学青藏高原人文环境研究院
报告题目:
对齐知识发现与智能决策:动态本体增强实体-关系模型
报告摘要:
传统知识图谱依赖实体-关系(E-R)模型构建静态语义结构,难以充分形式化复杂治理系统的动态演化、因果机制与情境依赖性,制约知识发现与智能决策的有效性。本研究提出动态本体增强的实体-关系模型(EER-DM),通过扩展传统框架,耦合“事件-状态-情境”动态范式,支持活性动态认知系统建模:(1)静态结构基础:实体作为核心认知单元,关系形成图谱骨架,确保结构化知识表示的完整性与语义连贯性。(2)动态过程建模:事件被形式化为系统跃迁的因果驱动器,引发实体属性变更与关系演变;其序列构成演化轨迹,支持推理追溯。状态则是事件作用下的实体时空快照。(3)情境保障机制:情境作为可信性元框架,绑定时间、空间、来源、方法与置信度元数据,促进可信评估、多版本事实并存及全链路追溯。EER-DM 模型构成了区域智能治理动态认知框架的知识基座,通过内嵌演化逻辑,为驱动认知引擎进行深度推理、因果发现与数字孪生推演提供底层模型支撑。
陈悦 教授
大连理工大学科学学与科技管理研究所
报告题目:
开放但不平等:大型天文科研设施的国际共享与科学领导力分布
报告摘要:
大型科研基础设施已成为当代科学政策的核心要素,兼具巨额资本投入与国际开放使用机制。然而,开放获取是否真正转化为更公平的科学权威分布,仍存在争议。天文学是一个典型案例:世界领先的天文台虽然实行全球共享,但其运行与成果仍深深植根于特定国家的制度与资源环境中。
本研究构建了一个覆盖1955年至2025年的数据集,系统关联天文观测设施的地理分布、论文使用情况及作者角色。通过区分“主办”、“使用”与“领导”三种科学参与方式的分析,发现仅靠国际开放获取并不能自动实现科学民主化。研究结果表明大型科研基础设施治理如何重塑全球科学等级,并为构建既共享数据又共享权威的科研体系提供了政策启示。
组织机构
DAKD2025
主办单位:中国科学院文献情报中心;广东医科大学
会议承办:广东省数智健康医疗工程技术研究中心;《数据分析与知识发现》编辑部
时间&地点
DAKD2025
会议时间:2025年10月31日-11月3日(含报到、疏散各一天)。
会议地点:广东省医科大学(东莞)
报名缴费
DAKD2025
普通代表:2000元,学生代表:1500元。请于2025年10月28日前完成缴费。上述费用含会议费、资料费、餐费,往返交通费及住宿自理。请登录会议网站报名并完成缴费,住宿预定等信息详见会议网站。
点击阅读全文完成报名

