一、阿里巴巴:开源模型与应用齐发力
1、通义实验室开源 Z-Image 图像生成模型
以 6B 参数实现接近 20B 参数级国际商业模型的视觉质量,核心特性包括:
-
采用轻量化单流 DiT 架构,提供 Turbo(快速推理)、Base(基础开发)、Edit(图像编辑)三大变体; -
8 步采样输出高清图像,显存占用≤16GB,支持 NVIDIA RTX30 系列等消费级显卡; -
具备复杂指令理解与中英双语文字渲染能力,解决传统模型文本处理痛点; -
遵循 Apache2.0 开源协议,已上线 GitHub、Hugging Face 及 ModelScope 平台。
-
项目地址:https://github.com/Tongyi-MAI/Z-Image; -
官网:https://tongyi-mai.github.io/Z-Image-homepage/ -
2、千问 App 下载量破千万
公测一周下载量突破 1000 万,创 AI 应用增长纪录,基于 Qwen 模型家族,定位 “会聊天能办事的个人 AI 助手”,未来将整合阿里电商、地图、本地生活等生态,强化 Agentic 能力。
-
二、字节跳动:输入法与编程工具上新
1、豆包输入法正式上线:面向安卓用户开放下载(iOS 版本即将推出),核心优势如下:
-
基于豆包同款语音模型,支持多方言、英语及中英混合输入,语音识别错误率较行业低 20%-50%; -
AI 驱动长句输入纠错与语境预测,安卓版支持联想计算公式; -
支持离线模型下载,界面无广告,iOS 版无需频繁跳转。
2、TRAE SOLO 模式中国版免费开放:实现端到端闭环开发,特点包括:
-
-
基于 “上下文工程” 理念,支持需求感知、任务分解与一键部署; -
新增 SOLO Coder(复杂任务处理)、上下文压缩、代码变更追踪等功能; -
SOLO Builder 可通过自然语言生成完整 Web 应用,目前 TRAE 中国版月活超 100 万,生成采纳代码超 60 亿行。
三、专业领域模型突破
1、DeepSeek 发布 DeepSeek-Math-V2 数学推理模型
6850 亿参数混合专家(MoE)模型,为全球首个开源 IMO 金牌水平数学推理模型:
-
-
采用 “生成 - 验证” 双模型闭环机制,提升推理可信度; -
在 IMO、CMO、Putnam 等赛事中表现优异,开源权重及训练细节; -
遵循 Apache2.0 协议,支持 Transformers 一键加载。
-
项目地址:https://huggingface.co/deepseek-ai/DeepSeek-Math-V2;https://github.com/deepseek-ai/DeepSeek-Math-V2/blob/main/DeepSeekMath_V2.pdf -
2、智谱 AI 清影 2.0 视频生成模型上线
支持文本直出 1080P 高清视频(最长 10 秒),核心亮点:
-
基于自研 CogVideoX 架构,可控制运动幅度、镜头语言及风格; -
配套 CogSound 音效模型实现视听一体生成,推理成本降低 30%; -
普通用户可通过智谱清言 App 免费体验,企业版开放 API 与私有化部署。
-
-
项目地址:https://yimingli-page.github.io/
四、创新工具与浏览器升级
1、YPrompt 聊天式提示词工程工具上线
通过对话交互挖掘用户需求,高效生成与优化提示词,功能包括:
-
-
支持表格、Markdown、代码块等多输出格式,可即时预览效果; -
提供版本管理功能,记录修改历史并支持对比回滚;
-
开源地址:https://github.com/fish2018/YPrompt 2、夸克 AI 浏览器推出系统级 AI 外挂
整合千问大模型,推出六大功能:
-
侧边栏总结、读屏、截屏识图、划词翻译、悬浮球、快捷框,支持 Alt+Space 快速调用; -
覆盖论文阅读、PPT 制作、PDF 处理等生产力场景,月费 19.9 美元,国内网络可直接使用。
以上内容覆盖国内 AI 领域最新动态,反映行业在轻量化、高效能、场景化方向的发展趋势。未来国内 AI 行业将迎更多突破,你最期待哪款产品升级?欢迎评论区留言。

