

随着各大平台纷纷宣布接入 DeepSeek,手机这一常用的个人智能终端也迎来了它的身影。其中,华为动作最为迅速,率先将 DeepSeek 集成到小艺助手中。作为 DeepSeek 首次在智能手机上的集成尝试,其表现备受关注,在第一时间进行了测试。

在将小艺助手升级到特定版本后,DeepSeek 正式现身小艺助手的智能体广场。从界面来看,华为小艺接入的 DeepSeek - R1 Beta 延续了小艺助手简洁直观的设计风格,分为上下两部分。上半部分有产品自我介绍及常见问题示例,方便初次使用者快速上手;下半部分为对话框,支持语音输入,语音内容能自动转化为文字即时发送,操作便捷。点击头像进入详情页面,能看到它基于 DeepSeek 开源版本部署,旨在为鸿蒙用户提供深度思考体验的介绍。不过,其设置相对简单,仅支持智能体音色、清除上下文和删除对话记录等基本操作,新开对话框功能暂未提供。

在深入测试前,有几个关键信息值得注意。首先,小艺版 DeepSeek - R1 Beta 仅在纯血鸿蒙版本的小艺助手中可用,鸿蒙 4.3 用户暂时无法体验。其次,它虽支持深度思考功能,但不展示详细思考过程。再者,对话框中没有联网搜索功能选项,不过答案有时会显示参考在线网页。另外,它在回答问题后会给出拓展选项,这是官方应用所没有的,且上下文长度略短,但日常基本够用。

衡量 AI 性能的一个重要因素是上下文长度。为测试小艺接入的 DeepSeek - R1 Beta 的上下文长度,测试者尝试输入不同长度文本。《三国演义》前三回约一万五千字,多次输入均提示失败,缩短至第一回约四千五百字仍未成功,直到选取约 700 字的新闻稿节选才得到成功输出。这表明其上下文长度在日常简单交流尚可,但应对长篇内容交流存在局限。

在输出质量方面,与满血版 R1 对比,差异较为明显。在经典测试问题“Strawberry 里有几个 r”上,小艺版 DeepSeek - R1 Beta 意外翻车,即便给出参考来源,答案和 r 的位置标注均错误,而官方应用则准确作答。在复杂问题测试上,如电车难题,小艺版 DeepSeek - R1 Beta 表现尚可,详细分析了不同选择后果及伦理含义。但在逻辑推理题“三人过桥”问题上,小艺版 DeepSeek - R1 Beta 得出 12 分钟的结论,与 ChatGPT 相同,而官方 app 则给出用时更短且逻辑更完备的答案。

在中文写作测试中,针对制作华为 Mate X6 折叠屏视频台词并兼顾画面设计的复合型任务要求,小艺版 DeepSeek - R1 Beta 给出了一份结构完整、口语化较好的台词设计,每句对白搭配相应画面设计,但诙谐有趣程度不足。

综合来看,受发布速度、集成妥协等因素影响,目前小艺接入的 DeepSeek - R1 Beta 在上下文长度性能和回答准确度上处于基础水平,有待后续迭代优化。不过,鉴于 DeepSeek 官网及官方应用连接条件不佳,其他云平台及本地部署使用门槛较高,在处理不太复杂的问题时,华为小艺中接入的 DeepSeek 不失为一个便捷选择。它虽暂时存在不足,但为用户提供了一种新的 AI 交互方式,随着技术不断发展与完善,有望在未来为用户带来更出色的体验,在 AI 应用领域占据更重要的一席之地。
—END—






