华为入局Coding Agent，Anthropic揭开AI“人格”之谜- 大数跨境

首页

华为入局Coding Agent，Anthropic揭开AI“人格”之谜

硅基星芒

2026-01-20

导读：大模型日报0120

重大发布（新模型/产品/开源）

① 智谱开源轻量模型GLM-4.7-Flash，免费开放使用

智谱团队今天正式推出新一代轻量模型 GLM-4.7-Flash，并宣布开源且免费开放接口调用。该模型采用“混合思考”架构，总参数300亿，实际运行中仅激活30亿参数，在确保高性能的同时大幅降低了运算成本。

在多项测试中，GLM-4.7-Flash 与当前两款主流轻量开源模型对比，在包括编程评测基准SWE-Bench在内的七项测试中，有六项取得领先成绩。其在编程、中文写作、翻译、长文本理解与角色扮演等实用场景中表现突出。

即日起，开发者可通过智谱开放平台免费调用该模型接口，也可在Hugging Face与魔搭社区获取开源版本。现有的GLM-4.5-Flash免费版将于1月30日下线，请求将自动迁移至新版。

短评：

智谱此次开源的定位很清晰——“小而强”，测试成绩也印证了这一点。免费且开源的策略大幅降低了中小企业与开发者的使用门槛，也为中文场景提供了可自行部署的高性能模型选择。当前AI应用逐渐落地，企业往往更关注任务成本与效率，而非一味追求参数规模。轻量模型更适合嵌入智能体或作为工具链的一环，这也是AI工程化的大势所趋。

② 华为云推出免费代码助手CodeArts Doer个人版

华为云近日发布 CodeArts Doer 代码智能体个人版，面向所有开发者免费开放。该产品定位为“AI原生编码助手”，不止能补全代码，更致力于成为融入开发全流程的智能协作者。

其核心功能围绕三个方面构建：

AI IDE：以AI为核心理念打造的开发环境，将需求分析、任务拆解、接口设计到代码生成整合在一个界面中，开发者用自然语言描述需求即可自动生成代码。
智能编程模式：提供“探索模式”快速验证想法，以及“规范模式”确保代码符合标准与安全规范。
代码库深度理解：可理解百万行规模的代码仓库，梳理模块依赖与业务逻辑，帮助团队新人快速上手、提升协作效率。

据官方介绍，该工具在项目级代码生成等场景中，平均可减少30%以上的重复编码工作。个人版已上线，支持选用GLM-4.7和DeepSeek-V3.2两种模型，企业版计划尚未公布。

短评：

CodeArts Doer展现了华为在AI原生研发工具链上的布局。但目前代码生成类工具缺乏公认的评测体系，华为也未公布具体量化对比，实际效果还需观察。此外，当前支持模型有限，生态开放度不足，可能影响开发者采纳。近一个月国内已有多款同类产品上市，竞争日趋同质化，CodeArts Doer需展现明显技术差异或场景优势才能真正脱颖而出。

③ 阶跃星辰AI桌面助手推出Windows版

继去年9月发布Mac版后，阶跃星辰近日正式推出 AI桌面伙伴Windows版，将智能助手能力扩展至Windows平台。该产品定位为“会做事、总在场、有记忆、能进化”的本地AI助手。

本次升级主要带来以下功能：

支持调用第三方工具：通过MCP协议，可操作Excel、QQ邮箱、飞书、钉钉、Notion、高德地图等16款常用软件，用户也可自行接入其他工具，实现如“读取工资表并群发邮件”等自动化任务。
全局记忆（目前仅Mac支持）：自动记录电脑操作轨迹，生成每日摘要，所有数据仅存于本地。
窗口内容识别（Mac已支持）：点击悬浮球可识别当前窗口内容并同步上下文。Windows版已上线基础功能，高级特性将逐步开放。

短评：

与多数国内厂商聚焦手机助手不同，阶跃星辰选择了与Anthropic Cowork类似的PC端路线。由于Windows/macOS系统开放度更高，AI助手可通过API和脚本实现跨应用操作，更贴合生产力场景中多任务、长流程的需求。

阶跃星辰通过MCP协议，无需各大厂商单独授权，即可让AI安全、结构化地调用各类软件，真正打通工作流，解决跨生态自动化难题，这一选择显得更为务实且具差异化。

技术进展（论文/SOTA/算法）

① Anthropic提出“助手轴”：AI也有“人格”，而且会漂移

Anthropic与牛津大学团队近日发布论文《助手轴：定位与稳定语言模型的默认人格》。研究发现，经过指令调优的大语言模型所呈现的“有用且无害的AI助手”形象，在模型的数学表示中对应一个明确的“方向”，团队将其命名为 “助手轴”。

但这种“助手”状态并不稳定。在面对特定对话情景（如情感倾诉、涉及AI意识的讨论）或恶意引导时，模型会发生 “人格漂移” ，脱离助手轴，进而产生有害或怪异回答。为解决这一问题，研究团队采用 “激活截断” 方法，将模型在助手轴上的激活值限制在正常区间，可在不影响能力的前提下显著降低有害行为。

研究首先绘制了模型的“人格地图”，提取模型扮演不同角色（如程序员、幽灵）时的数学向量，分析发现最主要的差异维度就是“像助手”与“不像助手”。有趣的是，“助手轴”在未经过调优的原始模型中就已存在，说明AI助手的人格并非无中生有，而是建立在预训练阶段学到的“乐于助人的专业人士”概念之上。

论文同时指出，在多轮对话中，某些高风险话题（如情感脆弱提问、哲学性质询）极易引发人格漂移，而编程、写作等明确任务则有助于保持助手状态。通过仅在其偏离时进行轻量干预，新方法在几乎不影响模型性能的情况下，将有害回答率降低约60%。

短评：

过去AI的失控事件常被笼统归因为“对齐失败”，而Anthropic的研究首次指出：大模型在对话中会沿着可测量的“人格空间”移动，一旦偏离“助手轴”，就可能产生幻觉或危险输出。这并非随机错误，而是模型内部结构的自然体现。

当前主流对齐方法（如RLHF）多侧重于训练末期“锁定”助手人格，却难以保障其在长对话中的稳定性。Anthropic的工作将AI安全机制从黑箱中揭示出一角，不仅解释了以往诸多异常案例，也为未来构建运行时监控与干预系统提供了新思路。

03
商业动态（融资/合作/财报）

① 郑钦文代言阿里通义千问，市场反响两极

1月19日晚，阿里通义千问团队宣布与中国网球运动员郑钦文达成全球品牌代言合作，并在B站同步发布三条宣传片。官方称，郑钦文“迎难而上、解决问题”的体育精神与千问APP“回答聪明、会办事”的定位相符；“千问”与“钦文”谐音，亦构成巧妙的品牌联想。

然而市场反响呈现两极。尽管有一条视频播放量破百万，但评论数寥寥，互动率偏低。部分用户认可体育代言有助于提升AI产品在大众尤其是非科技人群中的认知度；但也有不少技术社区用户提出质疑，认为阿里更应聚焦于产品与技术本身的提升。

短评：

阿里此次动作显示其正从技术层面向应用与市场层面加速推进，意图抢占C端AI市场。不过，当前该赛道已有字节跳动的豆包等产品凭借多模态体验占据用户心智，阿里千问的定位相对模糊，仅靠明星代言恐难形成突破。在竞争日趋激烈的AI应用市场，产品力与用户体验仍是立足之本。

【声明】内容源于网络

硅基星芒

专注人工智能研究、测评与媒体服务

内容 107

粉丝 0

硅基星芒专注人工智能研究、测评与媒体服务

总阅读8

粉丝0

内容107