《生成式AI技术全景地图》报告正式发布
沙丘社区
生成式AI领域正在快速发展,现有供应商加速推出产品,同时涌现出上百家初创企业。本报告展示了生成式AI技术全景地图,对关键技术领域进行定义和分析,并列举了典型供应商,帮助企业快速了解生成式AI技术的全貌。
沙丘智库将生成式AI技术全景地图定义为四个关键层:基础设施层、模型层、平台工具层和应用层,每一层都有特定的技术领域,其中有些技术领域随着生成式AI技术的出现而产生,而有些技术领域则在生成式AI出现之前就已经存在。
• 基础设施层:大模型的训练需要大规模、定制化基础设施的支持,尤其是在高性能GPU芯片方面,需求远远大于供给。
• 模型层:大模型目前是生成式AI技术生态创新和进步的重要驱动力。
• 平台工具层:随着生成式AI技术应用的不断成熟,企业需要寻求更高效的工具实现对应用的定制、自动化和管理。
• 应用层:随着现有供应商和初创企业将生成式AI技术嵌入到应用中实现企业工作流程的自动化,生成式AI应用正变得越来越常见。
大模型是生成式AI实现颠覆式发展的核心。大模型包括基础大模型、领域大模型,企业需要根据准确率、投入成本、价值实现周期、安全和隐私原则,选择适合企业的模型。
定义:通用大模型是在大量未标记互联网数据语料库上进行大规模预训练的模型,可以是基于transformer架构的模型(例如大多数的大语言模型),也可以是扩散模型(例如大多数的计算机视觉模型)。
重要性:通用大模型的出现为生成式AI领域带来了颠覆式革命。通过大模型的多功能性和多任务执行能力使其深受企业用户的欢迎。在基础大模型之上,一个庞大的API和应用生态系统正在建立。
典型厂商:阿里巴巴(通义千问)、百度(文心一言)、华为(盘古大模型)、科大讯飞(星火大模型)、智谱(GLM-4)
定义:虽然通用大模型是一项重大的技术进步,但由于其往往存在业务理解不足、缺乏行业深度、模型幻觉等问题,企业在大部分业务场景中更适合使用领域大模型。
随着Llama2、ChatGLM等开源大模型的普及,针对特定用例的领域大模型也应运而生。这些经过微调的模型可能是开源的,也可能是闭源的,但一般都比通用大模型小,通常针对特定用例或垂直行业的需求进行优化。一些开发基础模型的公司也会进一步发布微调后的领域模型(例如华为基于盘古大模型结合矿山应用场景与山东能源集团联合发布盘古矿山大模型)。
重要性:领域大模型可以提高企业内部的用例一致性,同时以更低的成本提供最高的准确率。通过使用特定领域的数据训练模型,领域大模型可能会降低幻觉风险,但也有可能牺牲一部分的通用性。
典型厂商:华为(盘古矿山大模型)、水木分子(BioMedGPT-10B )、同花顺(HithinkGPT大模型)