“我没有写过井位设计,也没有亲手打过钻井,但我写的代码,能成为找到超深层油气的‘好助手’。”10月27日,在西北油田生产科研园区的机房数据库,科研人员李国元讲述着自己的工作,语气里透露着庄重,即便在一排排大型服务器的嗡鸣声中也清晰有力。
他是西北油田勘探开发研究院数字信息化研究所信息应用组组长,这个四十出头的科研人员长相憨厚,给人第一眼的印象,看不出来是长期浸淫于代码之间的程序员。但是,在他滔滔不绝讲起人工智能时,他眼镜片后便闪耀着光芒。
2008年,他从通信与信息系统专业硕士毕业,来到西北油田,在机关工作了10多年。4年前,他看到勘探开发亟需数字化转型,便来到科研一线投身其中。
“藏在井位设计方案的数据、耗费在计算里的精力,都是人工智能扎根的沃土。信息化工作需要脚踏实地才能干出成效来,所以我就选择到了科研一线。”李国元说。
何以解忧
科研从“跑签字”到“点鼠标”
“我没有看到想象中堆砌如山的纸质报告,但是我仍然惊讶科研工作模式的繁琐。”李国元讲起刚到研究院的场景,仍然带着唏嘘。
他在资料室里,看到地质团队科研人员的电脑屏幕上,密集地排列着数十个文件夹窗口和PDF报告。为核实一口关键井的精确数据,他们一边通过内部通讯器,向不同项目的负责人索要最新版本的电子报告,一边在数以TB计的存档硬盘中,运用搜索软件进行海量检索。随之而来的,是在上百个文件名近似的图件与报告,再逐个打开,进行人工比对与核验。
“科研工具已经全面数字化,但是当时数据的流动仍依赖于人工‘拉取’,进行‘点对点’传递,这极大地依赖于研究者的经验与耐心。”当时,他便有了工作方向,要打造勘探开发数字海洋的导航罗盘,要让数据主动找人,而非人在数据中跋涉。
他经过梳理,发现因为保密工作,数据流动的审批流程相当繁琐。申请一次数据拷贝,要填1张纸质表,跑3个办公室签字,赶上谁出差,等两三天都是常事。
他带着团队,白天跟着科研人员记流程、找堵点,晚上对着代码框改逻辑,申请表的每一个选项都会反复琢磨。半个月后,线上审批系统上线,填信息后,审批权限自动流转,两小时就能拿到数据权限。
随后一段时间,科研团队逐步意识到信息化带来的改变。探井运行实现了探井井位建议表、地质设计、完井方案等7个业务流程全生命周期信息化管理,人才主数据平台解决了科研人员信息更新滞后的漏洞……一些小改进,逐渐转化为大变化。
“以前科研人员拷贝地震数据需要3天,现在线上审批,缩短至十几分钟。”地震数据管理人员胡文涛说。
赋能科研
给人工智能装上一颗“西北芯”
2023 年,全球 AI 热潮来袭,这让他得了“红眼病”,整天琢磨着与时俱进。
由于数据涉密,不能连通公共服务器,人工提取一篇油气论文的关键数据需要两天时间,AI却能快速完成。这时,西北油田勘探开发研究院正在开展“瀚海创客”项目,这是面向青年科研团队自主研发的模式,他借助这股“东风”,打造西北油田自主产权的AI大模型。
他反复计算机房GPU服务器的负荷量,对小组成员说:“公有云不能用,我们就自己建!搭建一个完全自主可控的本地 AI 平台。”
信息应用组的同事大吃一惊,全组就3个人,要干这么大的事?他们都惊叹于组长的“脑洞”之大。
“我把开源社区资料翻了遍,对比了十多种方案,大家一起来论证。只要我们干实事,就会干出个名堂来。”听他这么说,其他两人就这样被“忽悠”进来。
“我们打造的本地AI,最难的模型训练,即解决知识本地化的问题。”他说。
通用大模型碰到井眼轨迹、储层孔隙度等专业术语就“犯迷糊”,提取数据频频出错。他对症开方,给出“领域知识注入”的方案,把论文里的关键信息标出来,让模型跟着学。信息应用组便扎进文献堆,借助长城大模型的算力,把14万余篇核心论文按照标题、摘要、关键词、研究方法、研究成果、局限性、未来方向等13个标签逐个读取、逐个标记。在这些海量文档上,哪里是研究方法、哪里是实验数据,都标注得密密麻麻,他们再把标注内容“喂”给模型,每天调整着参数。
“这就像教一个孩子牙牙学语,需要耐心。看着准确率一点点往上‘攀爬’,有种把孩子教育成才的成就感。”李国元说。
自此以后,AI应用不断增加功能,论文精准查询、文献综述助手、成果查重等应用相继上线,论文研究周期从月缩短到周。今年,他带着团队将深地大模型本地AI平台升级为“全栈 AI 应用开发环境”,中国石化在西北地区190多名科研人员在平台建立了20多个本地知识库,累计解决1万多个专业问题。
“现在这个藏在机房里的‘AI 大脑’,成为了我们科技攻关的算力支撑。”深地团队成员龚伟说。
聚焦实效
让信息化成为科研“好助手”
“科研人员要的是工具,不是‘玩具’。”每次开发新应用,李国元先询问科研人员需求,需要就增加功能,不需要就删除。
今年7月,科研人员刘辛到雅克拉采气厂开展井斜校正工作。李国元向刘辛推荐了新出炉的瀚海创客成果井斜校正系统,特意叮嘱了离线模式的使用方法。
在荒漠中,刘辛运用系统,现场便完成井斜校正、地层校正、测井成果数据校正等5项井斜校正数据录入工作。等接通网络后,自动与桌面端进行了数据同步,远在千里之外的科研团队迅速收到信息,从而快速对开发井的轨迹进行了修订。
“不服不行,小功能解决了大问题,以前我得直奔机场,飞回去录入这些重要数据,真是科技改变工作模式啊!”科研人员刘辛说。
哪里有难题,哪里便是李国元信息化攻关的方向。前不久,他了解到储量评估管理系统试油数据采集“有难度”,人工录入耗时耗力。他便跟着储量团队学习了半个月,从基础常识到行业标准,再花功夫摸清了每张表格的逻辑,开发出自动化数据采集系统。
“解决实际问题需要花‘笨功夫’!”他说。
现在,试油报告放到指定文件夹,就能自动分离报告文字、图片和表格,再由AI生成符合行业标准的数据,导入储量评估管理系统,几分钟便能完成以前3至5天的工作量。
在生活中,李国元做事也讲究实际效果。他辅导孩子学习,给孩子说,英语硬学效果不好,让在日常对话、娱乐中找到英语学习方向。孩子的口语很快提升,参加全国小学生英语配音风采展示,入围了全国前50名。
他把这套逻辑用在了“师带徒”上。2022年,徒弟柴明锐从勘探团队转岗过来,李国元量身定制了三年培养计划,通过理论加实操的模式,让徒弟在实际工作中去探索方向。师徒先后取得OCP数据库认证专家、高级大数据分析师等9项专业技术认证,成为信息化工作的默契拍档。
★
★ ★ ★
★
素材:数字信息化研究所
审核:刘苹 郭鑫

