华为小艺版DeepSeek R1：初体验与性能剖析- 大数跨境

首页

华为小艺版DeepSeek R1：初体验与性能剖析

元龙数字智能科技

2025-02-07

DeepSeek R1

—华为小艺版—

初体验与性能剖析

在刚刚过去的春节期间，AI 领域可谓热闹非凡，一匹来自中国的黑马——DeepSeek 强势闯入大众视野。它凭借极低的训练成本实现了媲美 OpenAI o1 的性能，其强大的中文能力、令人惊叹的顿悟时刻以及秉持的开源精神，如同巨石投入平静湖面，在以 ChatGPT 为首的 AI 圈激起层层涟漪。

随着各大平台纷纷宣布接入 DeepSeek，手机这一常用的个人智能终端也迎来了它的身影。其中，华为动作最为迅速，率先将 DeepSeek 集成到小艺助手中。作为 DeepSeek 首次在智能手机上的集成尝试，其表现备受关注，在第一时间进行了测试。

在将小艺助手升级到特定版本后，DeepSeek 正式现身小艺助手的智能体广场。从界面来看，华为小艺接入的 DeepSeek - R1 Beta 延续了小艺助手简洁直观的设计风格，分为上下两部分。上半部分有产品自我介绍及常见问题示例，方便初次使用者快速上手；下半部分为对话框，支持语音输入，语音内容能自动转化为文字即时发送，操作便捷。点击头像进入详情页面，能看到它基于 DeepSeek 开源版本部署，旨在为鸿蒙用户提供深度思考体验的介绍。不过，其设置相对简单，仅支持智能体音色、清除上下文和删除对话记录等基本操作，新开对话框功能暂未提供。

在深入测试前，有几个关键信息值得注意。首先，小艺版 DeepSeek - R1 Beta 仅在纯血鸿蒙版本的小艺助手中可用，鸿蒙 4.3 用户暂时无法体验。其次，它虽支持深度思考功能，但不展示详细思考过程。再者，对话框中没有联网搜索功能选项，不过答案有时会显示参考在线网页。另外，它在回答问题后会给出拓展选项，这是官方应用所没有的，且上下文长度略短，但日常基本够用。

衡量 AI 性能的一个重要因素是上下文长度。为测试小艺接入的 DeepSeek - R1 Beta 的上下文长度，测试者尝试输入不同长度文本。《三国演义》前三回约一万五千字，多次输入均提示失败，缩短至第一回约四千五百字仍未成功，直到选取约 700 字的新闻稿节选才得到成功输出。这表明其上下文长度在日常简单交流尚可，但应对长篇内容交流存在局限。

在输出质量方面，与满血版 R1 对比，差异较为明显。在经典测试问题“Strawberry 里有几个 r”上，小艺版 DeepSeek - R1 Beta 意外翻车，即便给出参考来源，答案和 r 的位置标注均错误，而官方应用则准确作答。在复杂问题测试上，如电车难题，小艺版 DeepSeek - R1 Beta 表现尚可，详细分析了不同选择后果及伦理含义。但在逻辑推理题“三人过桥”问题上，小艺版 DeepSeek - R1 Beta 得出 12 分钟的结论，与 ChatGPT 相同，而官方 app 则给出用时更短且逻辑更完备的答案。

在中文写作测试中，针对制作华为 Mate X6 折叠屏视频台词并兼顾画面设计的复合型任务要求，小艺版 DeepSeek - R1 Beta 给出了一份结构完整、口语化较好的台词设计，每句对白搭配相应画面设计，但诙谐有趣程度不足。

综合来看，受发布速度、集成妥协等因素影响，目前小艺接入的 DeepSeek - R1 Beta 在上下文长度性能和回答准确度上处于基础水平，有待后续迭代优化。不过，鉴于 DeepSeek 官网及官方应用连接条件不佳，其他云平台及本地部署使用门槛较高，在处理不太复杂的问题时，华为小艺中接入的 DeepSeek 不失为一个便捷选择。它虽暂时存在不足，但为用户提供了一种新的 AI 交互方式，随着技术不断发展与完善，有望在未来为用户带来更出色的体验，在 AI 应用领域占据更重要的一席之地。

—END—

【声明】内容源于网络

元龙数字智能科技

永做第一使命第一向善第一

内容 901

粉丝 0

元龙数字智能科技永做第一使命第一向善第一

总阅读730

粉丝0

内容901