企业AI Agent如何使用才不踩坑？这3个经验很重要- 大数跨境

洞见畏来

2025-08-27

导读：企业AI代理怎么用才不踩坑？Block、GSK高管认为这3个经验更重要

当下企业圈，“AI代理（AI Agents）”绝对是顶流话题——这种能在工作流中自主、异步运行的工具，被视作提升效率的“新引擎”。但热闹背后，质疑声也在发酵：不少企业抱怨“雷声大，雨点小”， vendors吹得天花乱坠，实际落地却拿不出像样的案例。

Gartner更是直接点破现状：企业正处在AI代理的“期望膨胀顶峰”，接下来很可能因成果不及预期陷入“幻灭期”。不过，并非所有尝试都停留在空谈——支付巨头Block（旗下有Square、Cash App）和制药龙头GSK（葛兰素史克），已经在金融科技、药物研发领域跑出了早期成果。他们的实践，或许能给企业用AI代理提供“避坑指南”。

一、先搞懂：企业为什么怕AI代理“翻车”？

在聊案例前，得先明白企业对AI代理的核心顾虑：

“工具很好，用不起来”：很多AI代理功能强大，但要求员工改变现有工作习惯去适配，最终要么被闲置，要么用得磕磕绊绊；
“效果看不见，风险看得见”：尤其是金融、医疗等强监管行业，AI代理的决策是否合规、数据是否安全、结果是否可靠，都是悬在头上的“达摩克利斯之剑”；
“ hype大于实质”：不少厂商只强调“自主运行”“多任务处理”等概念，却没说清具体能解决企业哪类实际问题，投入产出比（ROI）模糊不清。

而Block和GSK的突破点，恰恰踩中了这些痛点——他们没把AI代理当“颠覆者”，而是当成“融入现有流程的帮手”。

二、Block案例：1个AI代理框架，让4000工程师每周省10小时

Block是一家拥有1万名员工的企业，旗下Square服务数百万商家，Cash App是北美热门支付工具。去年1月，他们推出了一款名为“Goose”的AI代理框架，如今已经覆盖4000名工程师，月 adoption率翻倍，核心成果让人眼前一亮：自动生成90%代码，帮工程师每周节省10小时。

1. Goose的核心逻辑：不搞“机器人军团”，只做“数字同事”

很多企业的AI工具会给员工推一堆功能入口，像“面对一群 bots 混战”，而Block的思路完全相反——Goose只有一个交互界面，让工程师感觉“在和一个同事合作”，但这个“同事”能同时在多个场景发力：

代码层面：在开发环境里实时工作，自动写代码、查bug、跑测试、装依赖，甚至能根据工程师的自然语言需求（比如“写一个用户支付数据统计模块”）生成数千行代码；
信息层面：自动梳理Slack聊天记录、邮件内容，提炼关键信息（比如“客户反馈的支付延迟问题”），不用工程师逐个翻消息；
工具层面：打通公司内部所有系统，比如连接Databricks数据库，让非技术岗也能通过自然语言查数据、写SQL（不用记复杂语法）。

Block的AI技术负责人Brad Axen说得很实在：“员工不在乎AI用了什么模型、什么协议，他们只在乎‘能不能帮我把事搞定’。所以Goose的核心是‘贴合现有工作流’，而不是让大家学新流程。”

2. 为什么能落地？3个关键设计

基于开源标准，灵活适配：Goose搭建在Anthropic的“模型上下文协议（MCP）”上——这是一套开源的API和接口标准，能轻松连接不同的数据仓库、开发工具。而且Goose本身用Apache 2.0协议开源，企业可以免费修改、商用，不用被绑定在特定厂商；
聚焦“小而实”的场景，不贪多：初期只针对“软件 engineering 任务”，比如代码生成、调试，验证效果后再扩展到信息汇总、客户数据整理等场景，避免“一上来就全场景覆盖，结果每个场景都做不好”；
不替代人，只放大专家价值：即便Goose能写90%代码，Block仍要求“人类工程师最终审核”——尤其是金融相关代码，必须确保合规、安全。Axen强调：“AI代理不是要取代专家，而是帮专家把‘写重复代码、查基础bug’这类机械活扛了，让他们专注在架构设计、风险控制这些核心事上。”

三、GSK案例：用AI代理加速药物研发，解决“数据太多，人算不过来”的难题

GSK是全球顶尖药企，主攻疫苗、传染病和肿瘤药物研发。对他们来说，AI代理的核心价值不是“省时间”，而是“突破人类分析能力的极限”——如今药企面临的最大问题是“数据爆炸”：基因数据、蛋白质数据、临床患者的实时监测数据（比如可穿戴设备收集的心率、血压）多到根本分析不完，传统研发流程往往要花数年才能验证一个药物靶点。

1. AI代理怎么帮研发？从“猜答案”到“找证据”

GSK的AI代理逻辑很特别：不追求“直接给出研发结论”，而是帮科学家“更快验证假设”。具体分3步：

第一步：整合多源数据，搭建“知识网络”：把基因（genomics）、蛋白质（proteomics）、临床数据，以及“疾病-药物”关联的专业术语体系（ontology）整合起来，让AI代理能理解“某个基因变异和卵巢癌的关系”“某种蛋白质是否能作为药物靶点”；
第二步：自主设计实验，压缩周期：比如科学家提出“XX基因可能是肺癌的新靶点”，AI代理会自动从内部数据库里拉取相关研究数据、临床案例，验证这个假设是否有依据，甚至能给出“下一步该做哪些实验验证”的建议——以前科学家要花几周查文献、整理数据，现在AI代理几小时就能完成；
第三步：多代理并行校验，控制风险：药企最怕AI“瞎编数据”（比如假阳性结果），所以GSK会让多个AI代理同时跑同一个任务，比如用两个不同的LLM分析同组基因数据，再让科学家交叉核对结果。他们还曾为了测试一个SQL代理的可靠性，让它连续运行1万次，就怕出现“突然报错、编造数据”的情况。

2. 研发场景的3个“反常识”经验

“大上下文窗口”不是万能的，会过滤才是关键：很多企业觉得“AI代理的上下文窗口越大，能处理的数据越多”，但GSK的AI负责人Kim Branson反驳：“你不能把所有数据都塞给LLM，指望它自己理清楚——就像给科学家一堆杂乱的论文，他也得先筛选重点。我们更看重AI代理的‘数据过滤能力’，只留下和研究目标相关的信息；”
不用“通用模型”，要建“专属模型”：GSK自己用Cerebras芯片搭建了“表观基因组语言模型”——这类模型只针对“基因调控”相关任务训练，比通用LLM更精准。Branson解释：“药物研发的场景太专业，外面的通用模型根本不懂‘某个基因突变对药物代谢的影响’，必须自己建专属模型；”
人类专家的“判断力”比AI的“答案”更重要：GSK会刻意收集“AI代理出错的案例”，比如“把无效的药物靶点当成有效”“误解了临床数据的统计逻辑”，让科学家分析原因，反过来优化AI的算法。Branson说：“我们不追求AI‘永远正确’，而是让人类在关键节点（比如是否推进某个药物进入临床试验）掌握最终决策权。”

四、企业用AI代理的“黄金法则”：3条来自巨头的经验

不管是Block的“工程师效率提升”，还是GSK的“药物研发加速”，本质上都遵循了3个相同的逻辑——这或许是所有企业用AI代理的“避坑指南”：

1. 先适配流程，再谈功能：别让员工“围着工具转”

Block和GSK的共同选择是“AI代理贴合现有工作流”，而不是“让员工改流程适配AI”。比如Block的工程师不用学新的开发工具，GSK的科学家不用改研究习惯，AI代理悄悄融入他们熟悉的环境（开发软件、实验设计系统），这种“低门槛”才是落地的关键。

2. 聚焦“小场景”突破，别贪“全场景覆盖”

两家企业都没一开始就“ALL IN”：Block从“代码生成”切入，GSK从“靶点验证”起步，先做出能看见的ROI（比如每周省10小时、研发周期缩短30%），再逐步扩展场景。反观很多企业，一上来就想让AI代理做“客户服务+数据分析+流程审批”，结果每个场景都做得马马虎虎，最终被弃用。

3. 永远给人类留“决策权”：AI是“帮手”不是“老板”

Block要求“人类审核代码”，GSK让“科学家核对AI结论”，核心都是“不把关键决策交给AI”。尤其是金融、医疗、制药这些强监管行业，AI代理可以做“数据整理、初步分析”，但最终的合规判断、风险评估、专业决策，必须由人类专家把控——这既是规避风险的需要，也是“放大人类价值”的关键。

五、总结

AI代理不是“万能神药”，但也不是“虚头巴脑的概念”。Block和GSK的案例证明：当AI代理贴合企业现有流程、聚焦具体场景、不越界替代人类专家时，就能真正创造价值。

对企业来说，与其纠结“要不要用AI代理”，不如先想清楚“我的员工每天花最多时间在哪些机械任务上？”“现有流程里哪个环节最容易卡壳？”——从这些“小问题”入手，用AI代理做“小改进”，或许比追求“颠覆式变革”更实际。毕竟，能解决实际问题的工具，才是好工具。

【声明】内容源于网络

洞见畏来

专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

内容 633

粉丝 0

洞见畏来专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

总阅读228

粉丝0

内容633