首页

最全AI大模型盘点与深度测评，你Pick哪一款？

先进制造业

2024-08-09

150

导读：共31款，堪称全网最全！详细介绍了每款大模型的主要功能和亮点，并提供对应的网址

国内主流大模型盘点：31款产品全解析，助力职场高效办公

科技大厂与创业新势力齐发力，AI大模型推动智能化升级

AI大模型作为人工智能技术的核心，依托海量数据训练，在语言理解、内容生成、逻辑推理等方面展现出强大能力，正深刻变革信息处理、智能交互与决策支持等场景，成为推动各行业数字化转型的关键力量

当前大模型已广泛应用于自然语言处理、图像视频分析、智能客服、教育个性化、医疗辅助诊断、金融风控及智能制造等领域，不仅能高效完成复杂数据分析，还可用于艺术创作与科学研究模拟，持续驱动社会生产力提升与智能化生活发展

除通用型语言模型（如GPT系列）、视觉模型（如ResNet、Transformer）和多模态模型外，针对工业、医疗、法律、金融等领域的专业大模型也不断涌现，结合行业数据解决特定问题，具备高价值与强实用性。此外，决策支持模型与生成对抗网络（GANs）等也在特定场景中发挥重要作用

『制造前沿』团队对国内主流大模型进行全面梳理，共盘点31款产品，涵盖科技巨头与创新企业，重点介绍其核心功能与技术亮点，并附官方使用链接，助力用户提升工作效率与智能化水平

本次盘点按开发者背景分为两类：一类为百度、华为、腾讯、阿里等科技大厂推出的大模型；另一类为聚焦垂直领域的创业新势力，尤其在工业、医疗、金融、智能决策等方向展现出强劲创新力

视频生成类大模型将另行专题分析，本文暂不涉及

01 科技大厂大模型

SUMMARY 文心一言

开发者：百度

功能：

文学创作：支持小说、诗歌、歌词、对联等文本生成
商业文案：可撰写广告语、商业计划书等营销内容
数理推算：具备数学逻辑推理与解题能力
中文理解：深度适配中文语境与表达习惯
多模态生成：融合文本、图像等多类型数据进行内容生成
OCR识别：将图片文字转化为可编辑文本
机器翻译：支持多语言实时互译
情感分析：识别并判断文本情绪倾向
文本生成：基于关键词或主题自动生成内容
语音识别：将语音内容转为文本
实体关系抽取：从文本中提取关键实体并建立关联模型

亮点：

已升级至文心一言4.0，通过百度智能云千帆平台提供完整开发工具链服务
集成五大核心能力，覆盖搜索问答、内容创作、智能办公等多元场景
企业级服务可通过千帆平台申请接入，便于规模化部署

网址：

https://yiyan.baidu.com/

讯飞星火

开发者：科大讯飞

功能：

多模理解：识别图片内容并生成准确描述
视觉问答：基于图像内容进行交互式问答
多模生成：支持音频、视频内容合成
虚拟人视频：快速生成数字人播报视频
知识问答：上传文件后提取关键信息进行对话
内容创作：结合文档生成报告、演讲稿、论文等
翻译/PPT生成：支持一键翻译与文档转PPT
AI润色：对文本进行修改、优化与扩展
结构化助手：通过角色设定创建定制化智能助手
流程编排：支持节点配置实现复杂任务自动化
轻应用开发：面向垂直场景提供独立交互功能

亮点：

整体能力对标GPT-4 Turbo，在文本生成与语言理解方面表现优异
Lite版本免费开放，提供模型定制工具
采用流式接口设计，首帧响应最快达毫秒级
支持37种语言，具备自动语种识别能力
语音合成高度拟人化，支持多语言多风格输出
云服务符合等保三级标准，保障数据安全

网址：

https://xinghuo.xfyun.cn/desk?b=1

SUMMARY 腾讯混元

开发者：腾讯

功能：

多轮对话：具备上下文理解与长文本记忆能力，支持专业领域问答
内容创作：涵盖文学创作、摘要生成、角色扮演等多种形式
逻辑推理：能准确理解用户意图并进行数据分析
知识增强：优化事实准确性与时效性，提升内容质量
多模态生成：支持文生图，将文字描述转化为图像
文档处理：提供创作、润色、校对等功能，提升写作效率
会议应用：支持会中问答、会议总结、待办事项整理
广告营销：可用于智能素材生成与导购系统构建

亮点：

采用混合专家模型（MoE）架构，参数规模达万亿级，擅长复杂任务处理
持续学习进化，覆盖五大核心能力，技术不断迭代
推出腾讯元宝（生活助手）与腾讯元器（智能体平台），拓展应用场景
已通过国家《生成式人工智能服务管理暂行办法》备案
开源文生图模型，促进技术共享与生态发展
发布加速库，推理效率提升75%，显著缩短生图时间

网址：

https://hunyuan.tencent.com/

通义千问

开发者：阿里云

功能：

文字创作：可撰写故事、公文、邮件、剧本、诗歌等
文本处理：支持润色、摘要提取等操作
编程辅助：帮助编写与优化代码
翻译服务：提供多语言互译功能
对话模拟：支持角色扮演式交互
数据可视化：协助图表制作与数据展示

亮点：

在中文场景下性能超越GPT-4 Turbo，被誉为“地表最强中文大模型”
在多轮对话、内容生成、逻辑推理等基准测试中表现突出
开源系列模型在开发者社区广受认可，提供多种尺寸适配不同部署需求
通义千问2.0在复杂指令理解与文学创作方面进一步优化，提升用户体验

网址：

https://tongyi.aliyun.com/qianwen/

SUMMARY 盘古大模型

开发者：华为云

功能：

盘古NLP大模型：千亿参数中文预训练模型，CLUE榜单领先
盘古CV大模型：基于海量视觉数据构建，支持按需抽取
盘古多模态大模型：融合语言与视觉信息，支持图文生成与理解
预测与科学计算模型：应用于气象、医药等结构化数据领域

亮点：

在小样本学习、微调及行业知识融合方面优势显著
以商业价值为导向，强调AI工业化与现实场景落地
已在能源、零售、金融等行业完成验证，获权威机构认可

网址：

https://www.huaweicloud.com/product/pangu

日日新SenseNova

开发者：商汤科技

功能：

商量（SenseChat）：自然语言处理模型，支持智能问答与对话
秒画：文生图模型，根据文本生成图像
如影（SenseAvatar）：数字人视频生成平台
多模态能力：支持长文本理解、综合推理、代码生成与跨模态交互

亮点：

支持文本、图像、视频、音频等多种模态，兼容中英文等多语言
已向开发者与研究者开放，推动技术生态共建
在长文本理解、推理、代码生成等方面部分能力超越GPT-4系列
推出端侧大模型，实现高性能本地化部署

网址：

https://platform.sensenova.cn/home#/home

SUMMARY 火山方舟

开发者：字节跳动旗下火山引擎

功能：

聚焦AI与数据创新，提供模型训练、推理、评测、精调等全栈服务
支持大模型生态建设，提供安全可信的技术方案

亮点：

倡导“技术普惠”，通过优惠定价降低企业与开发者使用门槛
基于互信计算架构，保障模型与数据全生命周期安全
已在金融、汽车、电商、教育等多个行业落地应用，展现全栈服务能力

网址：

https://www.volcengine.com/product/ark

360智脑

开发者：360

功能：

主流大模型功能与亮点盘点

360智脑大模型

支持多轮对话、文本生成、图像识别与生成、向量数据库服务及AI插件扩展
基于高质量语料训练，具备精准自然语言处理能力，支持API快速接入
符合行业安全标准，架构高可用，已全面接入360产品体系并对外开放
具备创作生成、逻辑推理等十大核心能力及数百项细分功能

官网： https://ai.360.com/open

蓝心大模型（vivo）

覆盖内容创作、知识问答、代码生成、法律金融分析、办公自动化及多语言翻译等场景
参数规模涵盖70亿至1750亿，配备2.6T多语言语料库，支持32K上下文处理
全链路自研，算法高效，注重安全合规，在多个应用场景中表现国内领先

官网： https://developers.vivo.com/product/ai/bluelm

天工AI（昆仑万维）

支持文案创作、知识问答、代码编程、数理推算、AI搜索、音乐生成、PPT制作及视频转绘
国内首个对标ChatGPT的双千亿级大模型，通过国家生成式AI服务备案
天工3.0采用MoE架构，响应更快、效率更高，推出国内首款AI搜索产品

官网： https://model-platform.tiangong.cn/

源大模型（浪潮信息）

提供文本生成、知识问答、数学推理、编程辅助及复杂逻辑理解能力
采用LFA（局部过滤自注意力）结构，整体性能接近GPT-4
源2.0在算法、数据、算力三方面升级，支持开发者共训并保持开源

官网： https://www.airyuan.cn/home

观澜大模型（海康威视）

提升产品算法准确性与智能感知能力，支持雷视多模态应用
实现AI落地性能平均提升超50%，降低样本依赖，加速工程化部署
广泛应用于智慧城市、智慧社区、自然资源保护等多个行业场景

官网： https://ai.hikvision.com/

小爱同学（小米）

支持沉浸式语音交互、男声音色、AI电话助理、语音订餐、语音遥控等功能
3.0版本实现手机端连续对话与随时打断，提升操作便捷性
具备联网搜索与信息提炼能力，提供高质量问答服务

官网： https://developers.xiaoai.mi.com/

网易数帆（网易）

聚焦智能编程、设计、测试与运营，助力低代码开发与业务自动化
结合大模型微调与知识增强技术，提升开发效率与交付速度
玉言大模型曾获CLUE中文理解测评分类任务冠军

官网： https://sf.163.com/

Kimi（月之暗面）

支持中英文多语言对话，最长可处理20万字输入输出，擅长长文本任务
可解析TXT、PDF、Word、PPT、Excel等文件及网页内容
具备搜索整合、代码生成能力，支持角色扮演与个性化定制（Kimi+）
严格遵守中国法规，拒绝敏感内容，保障对话安全合规

官网： https://kimi.moonshot.cn/

百小应（百川智能）

支持文件速读、资料整理、辅助创作，可通过提问明确用户需求
支持PDF、Word上传与网址输入，具备多轮与定向搜索能力
融合搜索与大模型技术，结构化呈现结果并标注来源
支持图片解读与语音交互，实现多模态输入

官网： https://ying.baichuan-ai.com/chat

智谱AI

支持中英文对话、100+编程语言代码生成与修复、图像生成与多模态理解
采用多阶段增强预训练，针对中文场景优化，权威评测表现优异
支持消费级显卡本地部署，可在RTX 3090等设备上高效推理
支持通过提示词创建个性化智能体

官网： https://www.zhipuai.cn/

国内主流大模型产品功能与亮点汇总

聚焦国产AI技术进展，梳理核心大模型平台能力与应用方向

MiniMax

开发者：海稀宇科技有限公司

功能：

涵盖逻辑推理、文本续写、文案生成、扩写与改写等文本处理能力。
支持内容摘要、代码生成、知识检索等高级语言任务。
具备声音大模型能力，适用于配音及音频交互场景。
支持多轮记忆、信息提取与知识问答。

亮点：

国内首个采用MoE（Mixture-of-Experts）架构的大语言模型，对标OpenAI GPT-4。
具备强大的多模态融合能力，适用于多种文本处理与交互场景。
提供安全、灵活、可靠的API服务，助力企业快速构建AI应用。
依托超大规模实验与推理平台，实现模型能力与用户交互量的高效扩展。

网址：https://www.minimaxi.com/

紫东太初

开发者：中国科学院自动化研究所联合武汉人工智能研究院、华为公司

功能：

覆盖音乐理解与生成、三维场景导航、信号理解、多模态对话等。
应用于神经外科手术导航、短视频内容审核、法律咨询、医疗多模态诊断、交通图像识别等场景。

亮点：

紫东太初2.0在1.0基础上升级，融合视频、信号、3D点云等模态，具备全模态理解与生成能力。
以自研算法为核心，基于国产昇腾AI平台，打造全栈国产化通用人工智能底座。
已在医疗、法律、交通等领域落地示范性应用。

网址：https://taichu-web.ia.ac.cn/

零一万物

开发者：零一万物公司（李开复博士带队孵化）

功能：

支持通用聊天、问答、写作、翻译等基础任务。
具备200K上下文支持，适用于多文档理解与知识库构建。
集成多模态模型，支持文本与视觉输入。

亮点：

200K超长上下文窗口可处理约30万字符，适合跨文档分析与知识融合。
多模态模型Yi-VL-Plus在中文图表识别方面优于GPT-4V，提升对图表、表格、截图等内容的理解能力。
推理速度快，API延迟低，支持与OpenAI接口兼容，便于迁移。

网址：https://platform.lingyiwanwu.com/

4ParadigmSage（先知 AIOS 5.0）

开发者：第四范式公司

功能：

支持通过自然语言交互构建行业大模型。
集成SageGPT与Model Hub平台，实现企业级模型构建、部署与管理。
支持信创算力与SLXLLM推理框架，提升性能。
提供算法揭榜平台与人才网络，增强模型应用效率。
支持私有化部署多模态模型，保障数据安全。
融合知识图谱与知识库，实现内容可溯源。
具备企业级Copilot能力，支持可控执行与错误修正。
支持思维链（CoT）进行多步推理与任务拆分。

亮点：

基于X模态数据构建行业基座模型，支持水文、健康报告等多种非文本数据处理。
提供医疗、水务、声学等领域的应用实例。
助力企业构建核心业务场景模型，提升行业效率。

网址：http://webmanage.4paradigm.com/product/4ParadigmSage.html

山海

开发者：云知声智能科技股份有限公司（国内AI语音领域独角兽）

功能：

通用能力：语言生成、理解、知识问答、逻辑推理、代码与数学能力。
落地能力：插件扩展、领域增强、企业定制。
行业应用：覆盖医疗、销售、知识管理、口语训练、智慧物联等场景。

亮点：

作为云知声AGI架构升级的关键，推动MaaS模式的AI 2.0解决方案。
目标在年内通用能力比肩ChatGPT，并在医疗、物联等垂直领域超越GPT-4。
支持私有化部署，提供精简回答与溯源功能，辅助企业技术文档理解。

网址：https://shanhai.unisound.com/

面壁智能

开发者：面壁智能公司

功能：

支持多语言处理与结构化输入输出。
通过高效微调技术适配多种下游任务。
具备问答、翻译、摘要、信息抽取、情感分析等能力。
MiniCPM-V 2.6支持实时视频理解与多图联合理解等端侧多模态能力。

亮点：

CPM-Cricket为千亿参数大模型，在逻辑、代码、知识等方面全面超越LLaMA2，性能接近GPT-4。
MiniCPM-V 2.6实现端侧高效运行，量化后内存仅需6GB，推理速度达18 tokens/s。
发布首个“大模型+Agent”SaaS产品ChatDev，推动软件开发革新。

网址：https://modelbest.cn/

MOSS

开发者：复旦大学自然语言处理实验室邱锡鹏团队

功能：

160亿参数开源对话模型，支持中英双语。
具备多轮对话能力。
可调用搜索引擎、文生图、计算器、方程求解等插件。
支持解方程、写代码、生成图片及伦理问题回答。

亮点：

国内首个开放测试的类ChatGPT产品。
可在单张NVIDIA 3090显卡上运行（低精度场景）。
开源地址发布于GitHub与Hugging Face，便于研究与开发使用。

网址：https://github.com/OpenMOSS/MOSS

孟子GPT

开发者：澜舟科技

功能：

支持多类型文章生成、语言理解、专业领域知识问答。
具备推理、代码理解与生成能力，支持百余种编程语言。
针对金融领域进行深度优化训练。

亮点：

实现类ChatGPT对话能力，集成安全可控功能引擎。
支持多参数规模迁移学习，按需配置资源。
支持对话效果定制，满足个性化业务需求。
融合行业数据、知识图谱与实时检索，构建行业专属大模型。

网址：https://www.langboat.com/portal/mengzi-gpt

中科闻歌雅意

开发者：中科闻歌（中国科学院孵化企业，专注认知与决策智能）

功能：

支持实时联网问答、领域知识问答、复杂信息抽取。
具备多语言理解与多模态内容生成能力。
雅意2.0支持10余种语言，具备图文交互与智能插件调用功能。

亮点：

拥有300亿参数，支持128K上下文（约20万字），中文任务表现领先。
在中文知识问答与零样本信息抽取评测中排名第一。
全系列模型开源，可通过GitHub与Hugging Face免费申请商用。
已在金融、法律、媒体、舆情、安全等领域落地应用。

网址：https://en.wengegroup.com/yayi/index.html

悟道

开发者：北京智源人工智能研究院

功能：

支持文本对话与多种语言生成任务。
集成视觉大模型，实现图文交互。
具备文本到代码生成能力。
支持类ChatGPT对话体验。
涵盖图像理解与生成的视觉大模型能力。
构建开源大模型评测体系与开放平台。

亮点：

悟道3.0系列全面开源，涵盖语言与视觉大模型。
支持中英双语，符合国内数据合规要求。
训练效率高，用更少数据和时间达到优异性能。
采用商用许可协议开源，促进科研与产业落地。
构建大规模高质量中文语料库WuDaoCorpora2.0。

网址：https://www.baai.ac.cn/portal/article/index/cid/49/id/518.html

Om Al：多模态AI技术助力企业数字化转型

开发者：杭州联汇科技股份有限公司

功能：

图文向量化：将图像与文本信息转化为向量形式
大词表目标检测：可识别并定位上千类目标物体
开放目标检测：支持无限类别的自定义物体识别
多模态大语言模型：融合语言与视觉信息，实现跨模态深度融合

亮点：

专注视觉语言场景，为AI应用开发提供新范式
具备视觉推理、描述与对话等多模态理解及智能交互能力
已在零售、酒店、景区、政务等多个行业落地数十种智能体应用，推动企业数字化升级

网址：

https://om.linker.cc/?_siteUrl=#/home

奇智孔明AInnoGC：面向制造业的AI2.0解决方案

开发者：创新奇智

企业级AI解决方案供应商，领先的“AI+制造”服务商

功能：

工业大模型AInno-15B：参数超150亿，专为工业场景设计，具备行业化、轻量化、多模态特点
大模型服务引擎：提供指令数据、模型精调、模型服务与提示工程，加速生成式AI应用开发与部署
ChatX系列应用：
- ChatRobot：实现自然语言到机器人指令的转化，支持工业任务编排
- ChatBI：生成式私域数据分析工具，支持SQL生成与可视化报表
- ChatDoc：企业知识问答系统，可精准检索与概括文档内容

亮点：

结合制造业深厚积累，提供从感知到决策的全链条AI能力
通过服务引擎助力企业构建专属大模型，加快AI应用落地
标志公司从AI1.0迈向AI2.0，完成技术双塔布局

从容：云从科技推出的多模态大模型

开发者：云从科技

国内首家登陆科创板的AI平台企业

功能：

支持问答、伴随、托管三种交互模式
具备文章生成、代码编辑、俗语解释等功能
可理解与生成自然语言，并标注参考资料来源
应用于金融、政务、教育、医疗、文娱等多个领域

亮点：

在问答、编程、写作、多语言及多模态任务中表现优异，支持个性化服务
具备上下文学习能力，提升交互体验，多轮对话技术已在金融、游戏等场景落地
已在多个关键领域成功应用，展现AI重塑工作与生活模式的潜力

网址：

https://maas.cloudwalk.com/web/#/login

赤兔：聚焦企业服务与营销的AI大模型

开发者：容联云

专注于企业营销与服务场景的数智化经营解决方案提供商

功能：

AI基础能力：支持上下文意图识别、情感分析、实体抽取与信息提取
会话洞察：智能标记与分析沟通记录，提升客服与营销效率
对话能力：基于大模型实现个性化、高质量的问答回复
人机协同：设计AI助手辅助坐席高效完成业务处理

亮点：

重构智能客服与数智化营销价值，推动沟通智能进入2.0时代
具备出色的交互式数值理解与分析能力，适用于营销数据分析等场景
容联云AI团队在AIGC关键技术上屡获权威评测优异成绩，相关成果已集成至赤兔大模型

网址：

https://www.yuntongxun.com/chitu

【声明】内容源于网络

先进制造业

各类跨境出海行业相关资讯

内容 0

粉丝 0

先进制造业各类跨境出海行业相关资讯

总阅读0

粉丝0

内容0