大数跨境

企业AI Agent如何使用才不踩坑?这3个经验很重要

企业AI Agent如何使用才不踩坑?这3个经验很重要 洞见畏来
2025-08-27
1
导读:企业AI代理怎么用才不踩坑?Block、GSK高管认为这3个经验更重要

当下企业圈,“AI代理(AI Agents)”绝对是顶流话题——这种能在工作流中自主、异步运行的工具,被视作提升效率的“新引擎”。但热闹背后,质疑声也在发酵:不少企业抱怨“雷声大,雨点小”, vendors吹得天花乱坠,实际落地却拿不出像样的案例。


Gartner更是直接点破现状:企业正处在AI代理的“期望膨胀顶峰”,接下来很可能因成果不及预期陷入“幻灭期”。不过,并非所有尝试都停留在空谈——支付巨头Block(旗下有Square、Cash App)和制药龙头GSK(葛兰素史克),已经在金融科技、药物研发领域跑出了早期成果。他们的实践,或许能给企业用AI代理提供“避坑指南”。

一、先搞懂:企业为什么怕AI代理“翻车”?

在聊案例前,得先明白企业对AI代理的核心顾虑:

  • “工具很好,用不起来”:很多AI代理功能强大,但要求员工改变现有工作习惯去适配,最终要么被闲置,要么用得磕磕绊绊;

  • “效果看不见,风险看得见”:尤其是金融、医疗等强监管行业,AI代理的决策是否合规、数据是否安全、结果是否可靠,都是悬在头上的“达摩克利斯之剑”;

  • “ hype大于实质”:不少厂商只强调“自主运行”“多任务处理”等概念,却没说清具体能解决企业哪类实际问题,投入产出比(ROI)模糊不清。

而Block和GSK的突破点,恰恰踩中了这些痛点——他们没把AI代理当“颠覆者”,而是当成“融入现有流程的帮手”。

二、Block案例:1个AI代理框架,让4000工程师每周省10小时

Block是一家拥有1万名员工的企业,旗下Square服务数百万商家,Cash App是北美热门支付工具。去年1月,他们推出了一款名为“Goose”的AI代理框架,如今已经覆盖4000名工程师,月 adoption率翻倍,核心成果让人眼前一亮:自动生成90%代码,帮工程师每周节省10小时

1. Goose的核心逻辑:不搞“机器人军团”,只做“数字同事”

很多企业的AI工具会给员工推一堆功能入口,像“面对一群 bots 混战”,而Block的思路完全相反——Goose只有一个交互界面,让工程师感觉“在和一个同事合作”,但这个“同事”能同时在多个场景发力:

  • 代码层面:在开发环境里实时工作,自动写代码、查bug、跑测试、装依赖,甚至能根据工程师的自然语言需求(比如“写一个用户支付数据统计模块”)生成数千行代码;

  • 信息层面:自动梳理Slack聊天记录、邮件内容,提炼关键信息(比如“客户反馈的支付延迟问题”),不用工程师逐个翻消息;

  • 工具层面:打通公司内部所有系统,比如连接Databricks数据库,让非技术岗也能通过自然语言查数据、写SQL(不用记复杂语法)。

Block的AI技术负责人Brad Axen说得很实在:“员工不在乎AI用了什么模型、什么协议,他们只在乎‘能不能帮我把事搞定’。所以Goose的核心是‘贴合现有工作流’,而不是让大家学新流程。”

2. 为什么能落地?3个关键设计

  • 基于开源标准,灵活适配:Goose搭建在Anthropic的“模型上下文协议(MCP)”上——这是一套开源的API和接口标准,能轻松连接不同的数据仓库、开发工具。而且Goose本身用Apache 2.0协议开源,企业可以免费修改、商用,不用被绑定在特定厂商;

  • 聚焦“小而实”的场景,不贪多:初期只针对“软件 engineering 任务”,比如代码生成、调试,验证效果后再扩展到信息汇总、客户数据整理等场景,避免“一上来就全场景覆盖,结果每个场景都做不好”;

  • 不替代人,只放大专家价值:即便Goose能写90%代码,Block仍要求“人类工程师最终审核”——尤其是金融相关代码,必须确保合规、安全。Axen强调:“AI代理不是要取代专家,而是帮专家把‘写重复代码、查基础bug’这类机械活扛了,让他们专注在架构设计、风险控制这些核心事上。”

三、GSK案例:用AI代理加速药物研发,解决“数据太多,人算不过来”的难题

GSK是全球顶尖药企,主攻疫苗、传染病和肿瘤药物研发。对他们来说,AI代理的核心价值不是“省时间”,而是“突破人类分析能力的极限”——如今药企面临的最大问题是“数据爆炸”:基因数据、蛋白质数据、临床患者的实时监测数据(比如可穿戴设备收集的心率、血压)多到根本分析不完,传统研发流程往往要花数年才能验证一个药物靶点。

1. AI代理怎么帮研发?从“猜答案”到“找证据”

GSK的AI代理逻辑很特别:不追求“直接给出研发结论”,而是帮科学家“更快验证假设”。具体分3步:

  • 第一步:整合多源数据,搭建“知识网络”:把基因(genomics)、蛋白质(proteomics)、临床数据,以及“疾病-药物”关联的专业术语体系(ontology)整合起来,让AI代理能理解“某个基因变异和卵巢癌的关系”“某种蛋白质是否能作为药物靶点”;

  • 第二步:自主设计实验,压缩周期:比如科学家提出“XX基因可能是肺癌的新靶点”,AI代理会自动从内部数据库里拉取相关研究数据、临床案例,验证这个假设是否有依据,甚至能给出“下一步该做哪些实验验证”的建议——以前科学家要花几周查文献、整理数据,现在AI代理几小时就能完成;

  • 第三步:多代理并行校验,控制风险:药企最怕AI“瞎编数据”(比如假阳性结果),所以GSK会让多个AI代理同时跑同一个任务,比如用两个不同的LLM分析同组基因数据,再让科学家交叉核对结果。他们还曾为了测试一个SQL代理的可靠性,让它连续运行1万次,就怕出现“突然报错、编造数据”的情况。

2. 研发场景的3个“反常识”经验

  • “大上下文窗口”不是万能的,会过滤才是关键:很多企业觉得“AI代理的上下文窗口越大,能处理的数据越多”,但GSK的AI负责人Kim Branson反驳:“你不能把所有数据都塞给LLM,指望它自己理清楚——就像给科学家一堆杂乱的论文,他也得先筛选重点。我们更看重AI代理的‘数据过滤能力’,只留下和研究目标相关的信息;”

  • 不用“通用模型”,要建“专属模型”:GSK自己用Cerebras芯片搭建了“表观基因组语言模型”——这类模型只针对“基因调控”相关任务训练,比通用LLM更精准。Branson解释:“药物研发的场景太专业,外面的通用模型根本不懂‘某个基因突变对药物代谢的影响’,必须自己建专属模型;”

  • 人类专家的“判断力”比AI的“答案”更重要:GSK会刻意收集“AI代理出错的案例”,比如“把无效的药物靶点当成有效”“误解了临床数据的统计逻辑”,让科学家分析原因,反过来优化AI的算法。Branson说:“我们不追求AI‘永远正确’,而是让人类在关键节点(比如是否推进某个药物进入临床试验)掌握最终决策权。”

四、企业用AI代理的“黄金法则”:3条来自巨头的经验

不管是Block的“工程师效率提升”,还是GSK的“药物研发加速”,本质上都遵循了3个相同的逻辑——这或许是所有企业用AI代理的“避坑指南”:

1. 先适配流程,再谈功能:别让员工“围着工具转”

Block和GSK的共同选择是“AI代理贴合现有工作流”,而不是“让员工改流程适配AI”。比如Block的工程师不用学新的开发工具,GSK的科学家不用改研究习惯,AI代理悄悄融入他们熟悉的环境(开发软件、实验设计系统),这种“低门槛”才是落地的关键。

2. 聚焦“小场景”突破,别贪“全场景覆盖”

两家企业都没一开始就“ALL IN”:Block从“代码生成”切入,GSK从“靶点验证”起步,先做出能看见的ROI(比如每周省10小时、研发周期缩短30%),再逐步扩展场景。反观很多企业,一上来就想让AI代理做“客户服务+数据分析+流程审批”,结果每个场景都做得马马虎虎,最终被弃用。

3. 永远给人类留“决策权”:AI是“帮手”不是“老板”

Block要求“人类审核代码”,GSK让“科学家核对AI结论”,核心都是“不把关键决策交给AI”。尤其是金融、医疗、制药这些强监管行业,AI代理可以做“数据整理、初步分析”,但最终的合规判断、风险评估、专业决策,必须由人类专家把控——这既是规避风险的需要,也是“放大人类价值”的关键。

五、总结

AI代理不是“万能神药”,但也不是“虚头巴脑的概念”。Block和GSK的案例证明:当AI代理贴合企业现有流程、聚焦具体场景、不越界替代人类专家时,就能真正创造价值。

对企业来说,与其纠结“要不要用AI代理”,不如先想清楚“我的员工每天花最多时间在哪些机械任务上?”“现有流程里哪个环节最容易卡壳?”——从这些“小问题”入手,用AI代理做“小改进”,或许比追求“颠覆式变革”更实际。毕竟,能解决实际问题的工具,才是好工具。


【声明】内容源于网络
0
0
洞见畏来
专注于前沿科技趋势,剖析底层算法逻辑,深耕商业化场景落地
内容 633
粉丝 0
洞见畏来 专注于前沿科技趋势,剖析底层算法逻辑,深耕商业化场景落地
总阅读228
粉丝0
内容633