大数跨境

化学领域的人工智能革命

化学领域的人工智能革命 国际项目创新平台-石化建设分会
2025-10-11
0
导读:美国化学会国际部(印度)

摘要

人工智能(AI)正通过加速科学发现进程、分析传统方法难以处理的复杂数据,重塑科学研究格局。本文综述分析了美国化学文摘社(CAS)内容合集中 2015—2025 年的超过 31 万篇期刊论文与专利,重点聚焦生物医学研究及材料科学领域。

基于数据的趋势分析显示,2020 年以来,人工智能相关成果在学术和产业领域均呈现爆发式增长。决策树、随机森林、支持向量机等传统机器学习(ML)方法仍是核心基础技术,在分子性质预测与分类任务中应用尤为广泛。不过,先进神经网络架构的应用比例正逐步提升:例如用于分子表征的图神经网络,以及用于全新化合物设计的生成模型。传统算法与深度学习相结合的混合方法及集成方法,因其稳健性与适应性优势,受到越来越多的青睐。

GPT、BERT、GEMINI 等大型语言模型(LLMs)正在改变文献挖掘、假说生成与实验规划的方式;AlphaFold 等领域专用模型及化学语言模型,则为蛋白质结构预测与反应结果预测领域带来突破性进展。

工业化学与化学工程领域对人工智能驱动的学术成果贡献日益增加,而生物化学领域的相关专利数量增长了 8 倍,这一数据充分体现了人工智能在科学发现与商业化转化两方面的双重影响。

尽管取得上述进展,挑战依然存在,尤其体现在数据隐私、数据质量、黑箱模型的可解释性,以及不确定性量化等方面。这些研究结果凸显了人工智能正从基于描述符的方法向端到端学习系统转型,为科研人员及政策制定者理解人工智能在科学领域的变革性作用,提供了关键参考



引言

图1  人工智能驱动的科学研究应用综合框架
每个六边形代表一种特定的人工智能驱动方法,用于提升科学研究方法与分析能力。



人工智能驱动科学研究的整体趋势

图2  各科学学科中应用的人工智能方法全景图
每个主分支突出展示相关模型 / 方法,采用颜色编码体系标识相关成果发表量(绿色代表发表量<10 篇,红色代表发表量>2 万篇)。数据来源于美国化学文摘社(CAS)内容合集中 2015—2025 年的期刊论文与专利 *。
*2025 年数据为部分数据,涵盖 1—3 月。

图3

(A)大型语言模型(LLMs)分布情况,插图聚焦最新 5 个模型;

(B)2025 年 5 月 27 日 —6 月 25 日(30 天内)Hugging Face 平台上大型语言模型的下载量;

(C-D)排名前 7 的大型语言模型相关科学成果年度趋势,其中(C)为期刊论文,(D)为专利族。
* 数据来源于美国化学文摘社(CAS)内容合集中 2015—2024 年的期刊论文与专利。

图4  研究中使用或开发人工智能相关工具的期刊论文与专利族年度趋势

数据来源于美国化学文摘社(CAS)内容合集中 2015—2025 年的期刊论文与专利 *。
*2025 年数据为部分数据,涵盖 1—3 月。

图5  2015—2024 年各学科研究中使用或开发人工智能相关工具的成果发表趋势

(A)期刊论文,(B)专利族。



地域与机构趋势

图6   

(A)人工智能相关成果发表量排名前列的国家 / 地区;(B)排名前五的国家 / 地区(中国、美国、印度、韩国、日本)的期刊论文与专利发表年度趋势。图 6A 数据来源于美国化学文摘社(CAS)内容合集中 2015—2025 年的期刊论文与专利,图 6B 数据来源于该合集 2015—2024 年的期刊论文与专利。
*2025 年数据为部分数据,涵盖 1—3 月。

图7  按专利族发表数量排名的领先(A)商业机构与(B)非商业机构

数据来源于美国化学文摘社(CAS)内容合集中 2015—2025 年的专利成果。2025 年数据为部分数据,涵盖 1—3 月。

图8  按期刊论文发表数量排名的领先学术机构

次坐标轴(橙色圆点)对应各机构每篇成果的平均引用量。数据来源于美国化学文摘社(CAS)内容合集中 2015—2025 年的期刊论文。2025 年数据为部分数据,涵盖 1—3 月。

图9  按刊载论文数量排名的领先科学期刊

次坐标轴(蓝色圆点)对应各期刊每篇成果的平均引用量。数据来源于美国化学文摘社(CAS)内容合集中 2015—2025 年的期刊论文。2025 年数据为部分数据,涵盖 1—3 月。

表1  人工智能相关重要期刊论文



人工智能在生物医学研究、材料科学及过程管理中的应用综合分析

图10  2015 年至 2025 年 3 月人工智能驱动的生物医学研究成果概念图谱

分为 5 个不同领域:生物化学、建模与药物设计、诊断、疾病、治疗。每个领域包含 15 个代表性概念,采用颜色编码(红色代表频次最高,蓝色代表频次最低)标识文献频次。

图11  桑基图展示人工智能方法与生物医学概念的共现关系

呈现人工智能方法在 5 个主要生物医学研究领域的分布情况

图12  基于发表频次的关键治疗物质类别增长趋势柱状图

(A)期刊论文;(B)专利成果

图13  人工智能驱动的材料科学研究成果概念图谱

分为 7 个类别。每个类别包含代表性概念,采用颜色编码(红色代表频次最高,蓝色代表频次最低)标识发表频次。

图14  桑基图展示人工智能方法与材料科学概念的共现关系

重点呈现各类机器学习模型 / 方法在材料科学不同类别中的应用情况。

图15  基于期刊论文和专利成果数量的材料科学关键物质类别柱状图

图16  展示人工智能在各科学领域推动研究、开发及运营过程现代化的作用框架图

参考

The AI Revolution in Chemistry: Shaping the Future of Materials and Biomedical Sciences

250902AIRevChem.pdf


注:AI辅助翻译,如有错误欢迎指出请以复制粘贴,附上本号名片的方式转载此文。



End 



【声明】内容源于网络
0
0
国际项目创新平台-石化建设分会
中国国际项目管理协同创新平台发起单位由重点企业、大学和科研单位、金融单位等组成,帮助 “一带一路”沿线国家的工业、基础设施等建设。石化建设分会,是2007年在民政部注册的非盈利社团机构。
内容 397
粉丝 0
国际项目创新平台-石化建设分会 中国国际项目管理协同创新平台发起单位由重点企业、大学和科研单位、金融单位等组成,帮助 “一带一路”沿线国家的工业、基础设施等建设。石化建设分会,是2007年在民政部注册的非盈利社团机构。
总阅读183
粉丝0
内容397