国内主流大模型盘点:31款产品全解析,助力职场高效办公
科技大厂与创业新势力齐发力,AI大模型推动智能化升级

AI大模型作为人工智能技术的核心,依托海量数据训练,在语言理解、内容生成、逻辑推理等方面展现出强大能力,正深刻变革信息处理、智能交互与决策支持等场景,成为推动各行业数字化转型的关键力量
当前大模型已广泛应用于自然语言处理、图像视频分析、智能客服、教育个性化、医疗辅助诊断、金融风控及智能制造等领域,不仅能高效完成复杂数据分析,还可用于艺术创作与科学研究模拟,持续驱动社会生产力提升与智能化生活发展
除通用型语言模型(如GPT系列)、视觉模型(如ResNet、Transformer)和多模态模型外,针对工业、医疗、法律、金融等领域的专业大模型也不断涌现,结合行业数据解决特定问题,具备高价值与强实用性。此外,决策支持模型与生成对抗网络(GANs)等也在特定场景中发挥重要作用
『制造前沿』团队对国内主流大模型进行全面梳理,共盘点31款产品,涵盖科技巨头与创新企业,重点介绍其核心功能与技术亮点,并附官方使用链接,助力用户提升工作效率与智能化水平
本次盘点按开发者背景分为两类:一类为百度、华为、腾讯、阿里等科技大厂推出的大模型;另一类为聚焦垂直领域的创业新势力,尤其在工业、医疗、金融、智能决策等方向展现出强劲创新力
视频生成类大模型将另行专题分析,本文暂不涉及

01 科技大厂大模型
SUMMARY 文心一言开发者:百度
功能:
- 文学创作:支持小说、诗歌、歌词、对联等文本生成
- 商业文案:可撰写广告语、商业计划书等营销内容
- 数理推算:具备数学逻辑推理与解题能力
- 中文理解:深度适配中文语境与表达习惯
- 多模态生成:融合文本、图像等多类型数据进行内容生成
- OCR识别:将图片文字转化为可编辑文本
- 机器翻译:支持多语言实时互译
- 情感分析:识别并判断文本情绪倾向
- 文本生成:基于关键词或主题自动生成内容
- 语音识别:将语音内容转为文本
- 实体关系抽取:从文本中提取关键实体并建立关联模型
亮点:
- 已升级至文心一言4.0,通过百度智能云千帆平台提供完整开发工具链服务
- 集成五大核心能力,覆盖搜索问答、内容创作、智能办公等多元场景
- 企业级服务可通过千帆平台申请接入,便于规模化部署
网址:
https://yiyan.baidu.com/
讯飞星火
开发者:科大讯飞
功能:
- 多模理解:识别图片内容并生成准确描述
- 视觉问答:基于图像内容进行交互式问答
- 多模生成:支持音频、视频内容合成
- 虚拟人视频:快速生成数字人播报视频
- 知识问答:上传文件后提取关键信息进行对话
- 内容创作:结合文档生成报告、演讲稿、论文等
- 翻译/PPT生成:支持一键翻译与文档转PPT
- AI润色:对文本进行修改、优化与扩展
- 结构化助手:通过角色设定创建定制化智能助手
- 流程编排:支持节点配置实现复杂任务自动化
- 轻应用开发:面向垂直场景提供独立交互功能
亮点:
- 整体能力对标GPT-4 Turbo,在文本生成与语言理解方面表现优异
- Lite版本免费开放,提供模型定制工具
- 采用流式接口设计,首帧响应最快达毫秒级
- 支持37种语言,具备自动语种识别能力
- 语音合成高度拟人化,支持多语言多风格输出
- 云服务符合等保三级标准,保障数据安全
网址:
https://xinghuo.xfyun.cn/desk?b=1
SUMMARY 腾讯混元
开发者:腾讯
功能:
- 多轮对话:具备上下文理解与长文本记忆能力,支持专业领域问答
- 内容创作:涵盖文学创作、摘要生成、角色扮演等多种形式
- 逻辑推理:能准确理解用户意图并进行数据分析
- 知识增强:优化事实准确性与时效性,提升内容质量
- 多模态生成:支持文生图,将文字描述转化为图像
- 文档处理:提供创作、润色、校对等功能,提升写作效率
- 会议应用:支持会中问答、会议总结、待办事项整理
- 广告营销:可用于智能素材生成与导购系统构建
亮点:
- 采用混合专家模型(MoE)架构,参数规模达万亿级,擅长复杂任务处理
- 持续学习进化,覆盖五大核心能力,技术不断迭代
- 推出腾讯元宝(生活助手)与腾讯元器(智能体平台),拓展应用场景
- 已通过国家《生成式人工智能服务管理暂行办法》备案
- 开源文生图模型,促进技术共享与生态发展
- 发布加速库,推理效率提升75%,显著缩短生图时间
网址:
https://hunyuan.tencent.com/
通义千问
开发者:阿里云
功能:
- 文字创作:可撰写故事、公文、邮件、剧本、诗歌等
- 文本处理:支持润色、摘要提取等操作
- 编程辅助:帮助编写与优化代码
- 翻译服务:提供多语言互译功能
- 对话模拟:支持角色扮演式交互
- 数据可视化:协助图表制作与数据展示
亮点:
- 在中文场景下性能超越GPT-4 Turbo,被誉为“地表最强中文大模型”
- 在多轮对话、内容生成、逻辑推理等基准测试中表现突出
- 开源系列模型在开发者社区广受认可,提供多种尺寸适配不同部署需求
- 通义千问2.0在复杂指令理解与文学创作方面进一步优化,提升用户体验
网址:
https://tongyi.aliyun.com/qianwen/
SUMMARY 盘古大模型
开发者:华为云
功能:
- 盘古NLP大模型:千亿参数中文预训练模型,CLUE榜单领先
- 盘古CV大模型:基于海量视觉数据构建,支持按需抽取
- 盘古多模态大模型:融合语言与视觉信息,支持图文生成与理解
- 预测与科学计算模型:应用于气象、医药等结构化数据领域
亮点:
- 在小样本学习、微调及行业知识融合方面优势显著
- 以商业价值为导向,强调AI工业化与现实场景落地
- 已在能源、零售、金融等行业完成验证,获权威机构认可
网址:
https://www.huaweicloud.com/product/pangu
日日新SenseNova
开发者:商汤科技
功能:
- 商量(SenseChat):自然语言处理模型,支持智能问答与对话
- 秒画:文生图模型,根据文本生成图像
- 如影(SenseAvatar):数字人视频生成平台
- 多模态能力:支持长文本理解、综合推理、代码生成与跨模态交互
亮点:
- 支持文本、图像、视频、音频等多种模态,兼容中英文等多语言
- 已向开发者与研究者开放,推动技术生态共建
- 在长文本理解、推理、代码生成等方面部分能力超越GPT-4系列
- 推出端侧大模型,实现高性能本地化部署
网址:
https://platform.sensenova.cn/home#/home
SUMMARY 火山方舟
开发者:字节跳动旗下火山引擎
功能:
- 聚焦AI与数据创新,提供模型训练、推理、评测、精调等全栈服务
- 支持大模型生态建设,提供安全可信的技术方案
亮点:
- 倡导“技术普惠”,通过优惠定价降低企业与开发者使用门槛
- 基于互信计算架构,保障模型与数据全生命周期安全
- 已在金融、汽车、电商、教育等多个行业落地应用,展现全栈服务能力
网址:
https://www.volcengine.com/product/ark
360智脑
开发者:360
功能:
主流大模型功能与亮点盘点
360智脑大模型
- 支持多轮对话、文本生成、图像识别与生成、向量数据库服务及AI插件扩展
- 基于高质量语料训练,具备精准自然语言处理能力,支持API快速接入
- 符合行业安全标准,架构高可用,已全面接入360产品体系并对外开放
- 具备创作生成、逻辑推理等十大核心能力及数百项细分功能
蓝心大模型(vivo)
- 覆盖内容创作、知识问答、代码生成、法律金融分析、办公自动化及多语言翻译等场景
- 参数规模涵盖70亿至1750亿,配备2.6T多语言语料库,支持32K上下文处理
- 全链路自研,算法高效,注重安全合规,在多个应用场景中表现国内领先
官网: https://developers.vivo.com/product/ai/bluelm
天工AI(昆仑万维)
- 支持文案创作、知识问答、代码编程、数理推算、AI搜索、音乐生成、PPT制作及视频转绘
- 国内首个对标ChatGPT的双千亿级大模型,通过国家生成式AI服务备案
- 天工3.0采用MoE架构,响应更快、效率更高,推出国内首款AI搜索产品
官网: https://model-platform.tiangong.cn/
源大模型(浪潮信息)
- 提供文本生成、知识问答、数学推理、编程辅助及复杂逻辑理解能力
- 采用LFA(局部过滤自注意力)结构,整体性能接近GPT-4
- 源2.0在算法、数据、算力三方面升级,支持开发者共训并保持开源
官网: https://www.airyuan.cn/home
观澜大模型(海康威视)
- 提升产品算法准确性与智能感知能力,支持雷视多模态应用
- 实现AI落地性能平均提升超50%,降低样本依赖,加速工程化部署
- 广泛应用于智慧城市、智慧社区、自然资源保护等多个行业场景
小爱同学(小米)
- 支持沉浸式语音交互、男声音色、AI电话助理、语音订餐、语音遥控等功能
- 3.0版本实现手机端连续对话与随时打断,提升操作便捷性
- 具备联网搜索与信息提炼能力,提供高质量问答服务
官网: https://developers.xiaoai.mi.com/
网易数帆(网易)
- 聚焦智能编程、设计、测试与运营,助力低代码开发与业务自动化
- 结合大模型微调与知识增强技术,提升开发效率与交付速度
- 玉言大模型曾获CLUE中文理解测评分类任务冠军
Kimi(月之暗面)
- 支持中英文多语言对话,最长可处理20万字输入输出,擅长长文本任务
- 可解析TXT、PDF、Word、PPT、Excel等文件及网页内容
- 具备搜索整合、代码生成能力,支持角色扮演与个性化定制(Kimi+)
- 严格遵守中国法规,拒绝敏感内容,保障对话安全合规
百小应(百川智能)
- 支持文件速读、资料整理、辅助创作,可通过提问明确用户需求
- 支持PDF、Word上传与网址输入,具备多轮与定向搜索能力
- 融合搜索与大模型技术,结构化呈现结果并标注来源
- 支持图片解读与语音交互,实现多模态输入
官网: https://ying.baichuan-ai.com/chat
智谱AI
- 支持中英文对话、100+编程语言代码生成与修复、图像生成与多模态理解
- 采用多阶段增强预训练,针对中文场景优化,权威评测表现优异
- 支持消费级显卡本地部署,可在RTX 3090等设备上高效推理
- 支持通过提示词创建个性化智能体
国内主流大模型产品功能与亮点汇总
聚焦国产AI技术进展,梳理核心大模型平台能力与应用方向
MiniMax
开发者:海稀宇科技有限公司
功能:
- 涵盖逻辑推理、文本续写、文案生成、扩写与改写等文本处理能力。
- 支持内容摘要、代码生成、知识检索等高级语言任务。
- 具备声音大模型能力,适用于配音及音频交互场景。
- 支持多轮记忆、信息提取与知识问答。
亮点:
- 国内首个采用MoE(Mixture-of-Experts)架构的大语言模型,对标OpenAI GPT-4。
- 具备强大的多模态融合能力,适用于多种文本处理与交互场景。
- 提供安全、灵活、可靠的API服务,助力企业快速构建AI应用。
- 依托超大规模实验与推理平台,实现模型能力与用户交互量的高效扩展。
紫东太初
开发者:中国科学院自动化研究所联合武汉人工智能研究院、华为公司
功能:
- 覆盖音乐理解与生成、三维场景导航、信号理解、多模态对话等。
- 应用于神经外科手术导航、短视频内容审核、法律咨询、医疗多模态诊断、交通图像识别等场景。
亮点:
- 紫东太初2.0在1.0基础上升级,融合视频、信号、3D点云等模态,具备全模态理解与生成能力。
- 以自研算法为核心,基于国产昇腾AI平台,打造全栈国产化通用人工智能底座。
- 已在医疗、法律、交通等领域落地示范性应用。
网址:https://taichu-web.ia.ac.cn/
零一万物
开发者:零一万物公司(李开复博士带队孵化)
功能:
- 支持通用聊天、问答、写作、翻译等基础任务。
- 具备200K上下文支持,适用于多文档理解与知识库构建。
- 集成多模态模型,支持文本与视觉输入。
亮点:
- 200K超长上下文窗口可处理约30万字符,适合跨文档分析与知识融合。
- 多模态模型Yi-VL-Plus在中文图表识别方面优于GPT-4V,提升对图表、表格、截图等内容的理解能力。
- 推理速度快,API延迟低,支持与OpenAI接口兼容,便于迁移。
网址:https://platform.lingyiwanwu.com/
4ParadigmSage(先知 AIOS 5.0)
开发者:第四范式公司
功能:
- 支持通过自然语言交互构建行业大模型。
- 集成SageGPT与Model Hub平台,实现企业级模型构建、部署与管理。
- 支持信创算力与SLXLLM推理框架,提升性能。
- 提供算法揭榜平台与人才网络,增强模型应用效率。
- 支持私有化部署多模态模型,保障数据安全。
- 融合知识图谱与知识库,实现内容可溯源。
- 具备企业级Copilot能力,支持可控执行与错误修正。
- 支持思维链(CoT)进行多步推理与任务拆分。
亮点:
- 基于X模态数据构建行业基座模型,支持水文、健康报告等多种非文本数据处理。
- 提供医疗、水务、声学等领域的应用实例。
- 助力企业构建核心业务场景模型,提升行业效率。
网址:http://webmanage.4paradigm.com/product/4ParadigmSage.html
山海
开发者:云知声智能科技股份有限公司(国内AI语音领域独角兽)
功能:
- 通用能力:语言生成、理解、知识问答、逻辑推理、代码与数学能力。
- 落地能力:插件扩展、领域增强、企业定制。
- 行业应用:覆盖医疗、销售、知识管理、口语训练、智慧物联等场景。
亮点:
- 作为云知声AGI架构升级的关键,推动MaaS模式的AI 2.0解决方案。
- 目标在年内通用能力比肩ChatGPT,并在医疗、物联等垂直领域超越GPT-4。
- 支持私有化部署,提供精简回答与溯源功能,辅助企业技术文档理解。
网址:https://shanhai.unisound.com/
面壁智能
开发者:面壁智能公司
功能:
- 支持多语言处理与结构化输入输出。
- 通过高效微调技术适配多种下游任务。
- 具备问答、翻译、摘要、信息抽取、情感分析等能力。
- MiniCPM-V 2.6支持实时视频理解与多图联合理解等端侧多模态能力。
亮点:
- CPM-Cricket为千亿参数大模型,在逻辑、代码、知识等方面全面超越LLaMA2,性能接近GPT-4。
- MiniCPM-V 2.6实现端侧高效运行,量化后内存仅需6GB,推理速度达18 tokens/s。
- 发布首个“大模型+Agent”SaaS产品ChatDev,推动软件开发革新。
MOSS
开发者:复旦大学自然语言处理实验室邱锡鹏团队
功能:
- 160亿参数开源对话模型,支持中英双语。
- 具备多轮对话能力。
- 可调用搜索引擎、文生图、计算器、方程求解等插件。
- 支持解方程、写代码、生成图片及伦理问题回答。
亮点:
- 国内首个开放测试的类ChatGPT产品。
- 可在单张NVIDIA 3090显卡上运行(低精度场景)。
- 开源地址发布于GitHub与Hugging Face,便于研究与开发使用。
网址:https://github.com/OpenMOSS/MOSS
孟子GPT
开发者:澜舟科技
功能:
- 支持多类型文章生成、语言理解、专业领域知识问答。
- 具备推理、代码理解与生成能力,支持百余种编程语言。
- 针对金融领域进行深度优化训练。
亮点:
- 实现类ChatGPT对话能力,集成安全可控功能引擎。
- 支持多参数规模迁移学习,按需配置资源。
- 支持对话效果定制,满足个性化业务需求。
- 融合行业数据、知识图谱与实时检索,构建行业专属大模型。
网址:https://www.langboat.com/portal/mengzi-gpt
中科闻歌雅意
开发者:中科闻歌(中国科学院孵化企业,专注认知与决策智能)
功能:
- 支持实时联网问答、领域知识问答、复杂信息抽取。
- 具备多语言理解与多模态内容生成能力。
- 雅意2.0支持10余种语言,具备图文交互与智能插件调用功能。
亮点:
- 拥有300亿参数,支持128K上下文(约20万字),中文任务表现领先。
- 在中文知识问答与零样本信息抽取评测中排名第一。
- 全系列模型开源,可通过GitHub与Hugging Face免费申请商用。
- 已在金融、法律、媒体、舆情、安全等领域落地应用。
网址:https://en.wengegroup.com/yayi/index.html
悟道
开发者:北京智源人工智能研究院
功能:
- 支持文本对话与多种语言生成任务。
- 集成视觉大模型,实现图文交互。
- 具备文本到代码生成能力。
- 支持类ChatGPT对话体验。
- 涵盖图像理解与生成的视觉大模型能力。
- 构建开源大模型评测体系与开放平台。
亮点:
- 悟道3.0系列全面开源,涵盖语言与视觉大模型。
- 支持中英双语,符合国内数据合规要求。
- 训练效率高,用更少数据和时间达到优异性能。
- 采用商用许可协议开源,促进科研与产业落地。
- 构建大规模高质量中文语料库WuDaoCorpora2.0。
网址:https://www.baai.ac.cn/portal/article/index/cid/49/id/518.html
Om Al:多模态AI技术助力企业数字化转型
开发者:杭州联汇科技股份有限公司
功能:
图文向量化:将图像与文本信息转化为向量形式
大词表目标检测:可识别并定位上千类目标物体
开放目标检测:支持无限类别的自定义物体识别
多模态大语言模型:融合语言与视觉信息,实现跨模态深度融合
亮点:
专注视觉语言场景,为AI应用开发提供新范式
具备视觉推理、描述与对话等多模态理解及智能交互能力
已在零售、酒店、景区、政务等多个行业落地数十种智能体应用,推动企业数字化升级
网址:
https://om.linker.cc/?_siteUrl=#/home
奇智孔明AInnoGC:面向制造业的AI2.0解决方案
开发者:创新奇智
企业级AI解决方案供应商,领先的“AI+制造”服务商
功能:
工业大模型AInno-15B:参数超150亿,专为工业场景设计,具备行业化、轻量化、多模态特点
大模型服务引擎:提供指令数据、模型精调、模型服务与提示工程,加速生成式AI应用开发与部署
ChatX系列应用:
- ChatRobot:实现自然语言到机器人指令的转化,支持工业任务编排
- ChatBI:生成式私域数据分析工具,支持SQL生成与可视化报表
- ChatDoc:企业知识问答系统,可精准检索与概括文档内容
亮点:
结合制造业深厚积累,提供从感知到决策的全链条AI能力
通过服务引擎助力企业构建专属大模型,加快AI应用落地
标志公司从AI1.0迈向AI2.0,完成技术双塔布局
从容:云从科技推出的多模态大模型
开发者:云从科技
国内首家登陆科创板的AI平台企业
功能:
支持问答、伴随、托管三种交互模式
具备文章生成、代码编辑、俗语解释等功能
可理解与生成自然语言,并标注参考资料来源
应用于金融、政务、教育、医疗、文娱等多个领域
亮点:
在问答、编程、写作、多语言及多模态任务中表现优异,支持个性化服务
具备上下文学习能力,提升交互体验,多轮对话技术已在金融、游戏等场景落地
已在多个关键领域成功应用,展现AI重塑工作与生活模式的潜力
网址:
https://maas.cloudwalk.com/web/#/login
赤兔:聚焦企业服务与营销的AI大模型
开发者:容联云
专注于企业营销与服务场景的数智化经营解决方案提供商
功能:
AI基础能力:支持上下文意图识别、情感分析、实体抽取与信息提取
会话洞察:智能标记与分析沟通记录,提升客服与营销效率
对话能力:基于大模型实现个性化、高质量的问答回复
人机协同:设计AI助手辅助坐席高效完成业务处理
亮点:
重构智能客服与数智化营销价值,推动沟通智能进入2.0时代
具备出色的交互式数值理解与分析能力,适用于营销数据分析等场景
容联云AI团队在AIGC关键技术上屡获权威评测优异成绩,相关成果已集成至赤兔大模型
网址:
https://www.yuntongxun.com/chitu


