大数跨境

上海建工四建集团AI研究室发布行业首个百亿字符知识增强“ChatGPT”

上海建工四建集团AI研究室发布行业首个百亿字符知识增强“ChatGPT” 上海建工四建科技
2023-10-25
1


行业首个


导读:由上海建工四建集团建筑人工智能研究室自主研发的建筑行业首个百亿字符知识增强对话大模型Construction-GPT(Beta版),在10月16日正式上线,预计今年年内开放建筑专业词嵌入、非结构化文件解析等相关API接口供行业使用。


Construction-GPT包含规范标准智能问答与查新、工程图集详图智能搜索、内控技术文件智能查询、私有知识库智能构建4项主要功能,实现了5000多本规范标准、1000多份工程图集、150多份企业内部技术文件的智能解析,技术人员通过对话问答方式,只需5~10秒就能够检索到需要的建筑工程技术资料,即使身处工地现场,也有“行业专家”随行。

全文共2055字,阅读大约需要5分钟

  |  张英楠 沈俊凯


近一年来,大语言模型(以下简称“大模型”)已经逐渐成为人工智能领域最热门的技术之一。通俗来讲,大模型指的是一种包含众多参数、由海量数据训练而成的、旨在理解和生成人类语言的人工智能模型。


包括chatGPT、“文心一言”、“讯飞星火”在内的通用大模型,可以实现文本总结、机器翻译、情感分析、数据处理等多项功能,众多数字化转型行业也开始引入大模型技术,拓展业务能力与市场生态,比如法律大模型“Lawyer LLaMA”、医疗大模型“灵医”等行业大模型等,都取得了良好的社会效益。


解决建筑行业痛点


建筑行业是传统行业,当前正处在数字化转型起步时期。在技术资料检索工作中,建筑行业仍然大量采用人工检索方式,效率低下,问题主要集中在——


建筑行业所涉及的规范标准数量庞大,更新速度快,同一个技术内容往往同时涉及多本规范标准要求与管理文件规定,难以全面检索;工程图集规模庞大,对于某一节点详图、构造做法的具体描述位置,难以快速检索;项目技术资料内容繁杂,而且同一个文件往往存在多个版本,难以准确检索。


针对这些痛点,上海建工四建集团建筑人工智能研究室自主研发了建筑行业首个百亿字符知识增强对话大模型Construction-GPT(Beta版),在10月16日正式上线,包括平台网页端、小程序端2种形式,供企业内部技术人员使用,利用大模型语言生成与知识推理的技术特性,实现建筑工程技术资料的智能检索。



Construction-GPT利用先进的大模型微调、扩展、迁移、应用技术,实现规范标准智能问答与查新、工程图集详图智能搜索、内控技术文件智能查询、私有知识库智能构建4项主要功能。


Construction-GPT的5大特点


  • 千亿级别模型参数,打造行业首个百亿字符知识增强对话大模型


四建集团的研发团队利用自主研发的建筑专业词嵌入模型、半监督微调、大模型价值对齐3项关键技术,实现了5000多本规范标准、1000多份工程图集、150多份企业内部技术文件的智能解析,技术人员可以通过对话问答方式,快速全面了解最新规范标准、工程图集、内部技术文件中的详细规定和要求。


与传统人工检索方式相比,技术人员能够一次性快速获得多本技术资料中的相关信息,节省了大量时间;和通用大模型相比,Construction-GPT不依赖互联网知识库,同时加载了敏感词过滤算法,为工程技术问题提供更专业、更科学、更合理的解答。


技术知识智能检索


  • 高效的模型推理能力,让回答无杜撰、可追溯、易查询


AIDAC数据吞吐加速技术的采用,提高了Construction-GPT模型的推理速度,在无网络延迟测试下,回答仅需5~10秒。Construction-GPT还打破了以往通用大模型的“谣言机制”,杜绝了答非所问、信息杜撰的情况出现。技术人员能够精确选择大模型索引知识库范围,为每个回答提供准确信息和索引资料来源,一键打开索引资料链接,就可以继续深度查询和检索。


以“女儿墙构造详图”为例,可同步检索到多本工程图集涉及女儿墙构造详图的具体位置信息,打开索引资料,了解详细做法。


工程图集智能查询


  • 支持私有知识库建立,打造个人专属智能知识系统


除了规范标准、工程图集、公司内部技术文件等公共技术资料外,技术人员往往还需要根据个人存储资料开展相关检索。


为此,研发团队自主研发了多模态数据解析算法,技术人员只需要一键上传文件,Construction-GPT就可以自动解析包括docx、doc、pptx、ppt、xlsx、xls、dwg、pdf、png、jpg、mp3、wav等在内的24种文档、图纸、音频格式文件,建立个人专属知识空间,打造个人专属智能知识检索系统。


私有知识库智能构建


  • 规范标准一键查新,更多实验室功能辅助项目办公


建筑行业涉及规范标准数量庞大,更新速度快,技术人员常常难以了解规范标准最新修编情况。


研发团队特别建立了规范标准动态数据库,利用近似字符串最优匹配算法,开发了规范标准智能查新功能模块,技术人员一键复制粘贴,就可以快速生成最新结果。今后,Construction-GPT还将上线更多实验室功能模块,助力技术人员的高效办公。


规范标准智能查新


  • 同步上线Construction-GPT小程序,即使身处工地,也能即刻问答


除了平台网页端,为了方便技术人员随时随地检索技术资料,研发团队同步开发了Construction-GPT小程序端。


在同一账号下,小程序端与平台网页端可以实时同步历史问答对话内容,并支持语音输入,方便身处工地现场的技术人员使用,让“行业专家”随时在身边。


小程序端部分操作界面




未来,四建集团建筑人工智能研究室将基于RLHF技术,根据用户使用反馈结果开展强化学习,进一步优化Construction-GPT模型性能,扩展Construction-GPT产品功能,为一线技术人员的项目管理工作提供有力支撑,推动四建集团乃至行业的数字化转型升级。


文章来源:上海建工

【声明】内容源于网络
0
0
上海建工四建科技
本公众号为上海建工四建集团有限公司科技类信息官方发布平台。
内容 0
粉丝 0
上海建工四建科技 本公众号为上海建工四建集团有限公司科技类信息官方发布平台。
总阅读0
粉丝0
内容0