大数跨境

基于科创大数据与AI大模型融合的科创空间全要素研发管理系统

基于科创大数据与AI大模型融合的科创空间全要素研发管理系统 广东省数字化学会
2025-01-05
1
导读:第四届工业软件创新应用大赛作品巡礼(12)





随着“内卷”加剧,中国企业生存发展面临“两难”问题:研发创新难、订单获取难。建设高质量语料库和基础科学数据库,强化拓展科学数据资源的场景应用,形成可复制、可推广的解决方案,是解决“两难”问题的重要手段。

来自企知道科技有限公司的企知道科创空间系统开发团队的作品《基于科创大数据与AI大模型融合的科创空间全要素研发管理系统》,通过自研科创垂类大模型,融汇全球300多条产业链的行业知识与科创实践,在国内最先将AI大模型应用于科创领域,获得本届大赛工业AI应用场景创新奖。


▲点击查看视频





产品核心优势

1、中国规模最大的科创数据库

科创数据库拥有300亿企业相关数据。

2、多源异构数据治理

各领域产业专家2000人深度参与多源异构数据治理。

3、多维创新情报及应用场景

全场景科创服务,融汇行业知识与科创实践,公私域数据,形成深度理解、智能生成的科创AI能力,提供多维创新情报及场景应用。

4、率先实现国产科创大模型的应用

企知道科创GPT大模型成为首个通过国家备案、具备全球科创数据智能服务能力的大模型。





解决方案

1

架构设计

利用大模型能力、文献计量、语义分析等技术,通过深入数据治理,以产业链作为骨架,丰富产业链上各节点的有效信息,从而形成多维度数据的整合分析,为企业提供高质量的科学数据资源与知识服务。


2

方案功能

本项目基于千亿级科创语料库,率先实现国产科创大模型的落地应用,形成可复制、可推广的赋能企业创新的解决方案。本项目打造“一平台+两空间”的创新服务生态系统,包括企知道平台、科创空间、商贸空间。


1、汇集治理科技情报各维度全球大数据

平台汇集治理科技情报各维度全球大数据,并通过行业专家对30万家中小企业的服务实践进行人工总结分析,分层分级进行数据标记、加工,形成高质量的数据库。数据来源包括:国家知识产权局、国家信息中心授权的公共数据;与国家部委合作项目共建获取的数据;人民数据、中宏大数据等国家队合作获取的数据;国内外合规采集与采购的社会数据。


2、融合数千名领域专家的经验和知识

本项目融合2000多名行业专家参与治理,将专家知识和领域知识融入模型,实现数据标签化,数据产业化,数据知识化。


3、构建科技情报垂直领域专属大模型

基于海量科创数据以及在深度学习、多模态感知等方面的技术积累,构建科技情报垂直领域专属大模型。


4、首创一站式科创知识问答服务模式


3

关键技术

1、全生命周期的大模型中台

企知道大模型基于业内先进的开源基座,在此基础上进行二次预训练以及SFT精调。结合科创数据要素,为企业客户及个人用户提供关键信息的精准检索,汇总,分析能力。


2、业界领先的数据图谱+RAG技术+插件生态

知识图谱构建:构建的向量存储在数据库中,辅助挖掘向量之间的边关系从而得到知识图谱整体框架。

多模态数据处理:存储这些不同模态数据的向量表示,帮助跨模态的搜索和分析。

特征存储:向量数据库可以用来存储这些特征,便于后续的模型推理和分析。

完整性:帮助大模型充分使用1.8亿的专利数据,2亿+期刊数据优势,1000+hive表数据。





技术与产品创新

1、首创科创AI应用矩阵,自研科创垂类大模型,填补AI大模型科创情报服务领域空白。

2、采用RAG检索增强技术,融合跨行业专家知识,有效解决模型幻觉、知识陈旧等大模型顽疾。

3、首创一站式科创知识问答服务模式,透视产业链上中下游关系,科创智能服务与应用领域“补短板”。





团队有话说:

科创空间全要素研发管理系统-赋能企业发展新质生产力!

▲扫码访问官网



关于大赛及栏目

第四届工业软件创新应用大赛(人工智能+方向)于2024年9月线上启动,刚发布即获得产业界高度关注,最终来自全国共98家团队报名参与。大赛涌现了非常多在“AI+工业软件”进行创新与实践的优秀团队,产生技术创新奖13名,应用场景创新奖13名,玉兰奖3名,优秀奖12名。特设大赛作品巡礼栏目,集中展示大赛创新成果,共同探索新一代工业软件发展路径。




微信号广东省数字化学会

关注我们|大赛作品持续更新

戳“阅读原文”,查看大赛获奖名单

【声明】内容源于网络
0
0
广东省数字化学会
帮助企业数字化转型,让数据成为生产力
内容 1127
粉丝 0
广东省数字化学会 帮助企业数字化转型,让数据成为生产力
总阅读359
粉丝0
内容1.1k