圆满落幕!TAG-HUB 亮相第十三届全国环境化学大会
为期五天的第十三届全国环境化学大会于 12 月 2 日在广东江门五邑大学圆满落幕。本届大会以 “创新环境科学,推动绿色发展” 为核心主题,吸引了万余名国内外环境化学领域的顶尖专家、学者齐聚一堂,通过院士主旨报告、专题学术研讨、成果展示交流等多元形式,共话行业发展趋势,共谋绿色创新蓝图。
作为铜牌赞助商,TAG-HUB 携 “AI + 大数据” 阶段性进展在展会进行汇报分享。
本次展会,TagHub于 第1分会场 计算毒理、机器学习与大数据分析分会场、第 6分会场 环境暴露组学大数据与人工智能分会场 及 第 23 分会场 地下水污染与修复分会场,分享了关于AI + 大数据 赋能环境化学领域的汇报。
以下为分会场现场的部分提问及回复:
Q1
是否可以进行单位换算,是否可挖掘经纬度?
单位换算属于数据清洗阶段,严格来说不输于数据挖掘,对这部分是额外的工作量,不过我们有相关的自研算法,匹配经纬度,换算浓度等。我们已有但部分指标不建议进行单位换算,如不同介质中的浓度,mg/g和mg/m³等,有逻辑上的匹配关系。另外位置坐标也可根据所在的省、市州、县等,反向匹配经纬度。截至25年10月,我们已累计清洗超1000个数据指标,上架100+数据指标,可直接用程序调用API接口,即可获得清洗后的结构化公开数据。
Q2
文献数据挖掘服务是用纯AI工具吗,会配合自研算法使挖掘结果更准确吗?
参考刚才分享的nuture子刊上的成果,纯AI的挖掘方式的准确率只能到60~80%,这是肯定到不了科研级的标准的。我们是人机协作(Human-in-the-Loop)的工作流,并不是纯AI挖掘方式,我们有超过1000多个本地的算法模块,包括很多校验算法,可以把常见的幻觉识别出来,每篇文章可能会经过2~4次人工断点参与。同时我们也在不断的进行算法的优化和迭代,保证交付的准确性可以达到95%以上,可以达到顶刊发表的标准。
Q3
是否可以同时挖掘文本、表格和图片?
我们目前已经进行了技术突破,加入了计算机视觉算法,可批量从曲线中提取点坐标,但过程中同样需要加入强人工审核。图片数据挖掘需要一事一议,根据图片单独报价,可以提取简单的折线图、散点图、曲线图、条形图、箱线图,包括一些表征结果中的数据。未来也会继续优化算法,提高图片挖掘效率及准确率。
此外,本次展会精心策划并设置转盘互动环节,送出茶礼、耳机、鼠标、U 盘等500+份礼品,以及含双肩包在内的科研大礼包 1 份。活动现场组织有序、氛围热烈。
此次大会的落幕,是结束也是新的开始。未来,TAG-HUB 将继续深耕 “AI + 大数据” 与环境化学的交叉领域,不断打磨技术、积累经验,持续优化定制化服务,努力为科研工作者提供更多支持,也期待与行业同仁携手,为环境科学进步、绿色可持续发展贡献微薄之力。
想做自己的垂直领域大数据研究(电池、陶瓷、金属、医药、蛋白、环境、生态、材料、农学、地质等),TAG-HUB可提供定制化科研数据集挖掘、数据库搭建。并可配套数据集提供机器学习模拟、语言模型训练部署等深度建模任务。


