Harvey为什么开始训练自己的法律模型？- 大数跨境

首页

Harvey为什么开始训练自己的法律模型？

智合AI公众号

2026-06-22

导读：从“调用最强模型”，到“拥有自己的智能”

在法律AI应用领域，Harvey无疑是最耀眼的明星公司之一

本文作者：之声

6月18日，Harvey联合创始人兼总裁Gabriel Pereyra在X上公布了一个重要消息：Harvey正在开发法律基础模型系列的第一个模型。

Gabriel为这个项目设定了两个目标。

第一个目标，是以更可承受的成本、更强的安全性，把接近前沿水平的智能部署到Harvey的各个产品之中。

第二个目标，则更值得关注：为律所建立基础，使其能够训练自己的专业模型，进而“拥有自己的智能”。

这句话可能比“Harvey开始训练模型”本身更加重要。

因为它意味着，Harvey正在重新定义法律AI公司与律所之间的关系。未来的律所购买的，可能不再只是一个外部AI工具，而是一套能够承载自身知识、流程、经验和客户关系的专业智能系统。

Harvey也因此开始从一家法律AI应用公司，转向一家法律智能基础设施公司。

 
  Harvey不是要替代GPT，而是要重新分配模型任务

Harvey训练自己的模型，并不意味着它准备放弃GPT、Claude或者其他前沿模型。在可以预见的未来，最强的通用模型仍然会在复杂推理、开放性研究和疑难问题处理中发挥不可替代的作用。

但并不是每一项法律任务，都需要调用最昂贵、最强大的模型。

法律工作中存在大量高频、重复和相对确定的环节，例如文件分类、条款提取、事实整理、信息核验、格式转换、初步检索和标准文本生成。如果这些任务全部调用前沿模型，随着用户数量和Agent运行次数增加，模型成本会迅速成为Harvey商业模式的约束。

因此，Harvey更可能建立一套分层模型体系：

•普通任务交给成本更低的模型

•专业法律任务交给自有法律模型

•最复杂的推理和判断再升级到GPT、Claude等前沿模型

Harvey真正需要掌握的，不一定是世界上参数最多的模型，而是判断什么任务应当交给什么模型。

自建模型不是对多模型战略的否定，而是多模型战略走向成熟的标志。

 
  法律AI正在从“生成答案”走向“完成事项”

Gabriel在发言中提出，Harvey的模型将重点处理持续数月、需要数十名律师共同完成的复杂客户事项。这与过去的法律AI产品有本质区别。

过去，人们衡量法律AI的能力，通常会问：

它能不能回答一个法律问题？
能不能写一份合同？
能不能总结一批文件？

但一个真实的重大交易、诉讼或者监管项目，并不是由一个问题和一份文书组成的。

它可能持续几个月，涉及数千份文件、数百个任务节点和多轮客户沟通。律师需要不断发现新事实、修正判断、分配任务、核验依据，并把不同阶段的工作成果组合成最终交付物。

因此，真正困难的并不是生成某一段文字，而是维持一个长周期任务的连续性。

模型必须知道当前项目进行到了哪里，哪些事实已经确认，哪些问题尚未解决，哪些工作可以自动执行，哪些判断需要提交给高级律师。

这也是为什么Gabriel把未来的Agent形容为类似一名高级律师。它不仅要完成任务，还要学会调用法律科技工具、调度子Agent，并判断什么时候应当向更强的模型或者人类合伙人求助。

Harvey训练的不是一个更会说法律语言的聊天机器人，而是一个能够参与法律生产过程的执行系统。

 
  通用模型知道法律，但未必知道律所如何工作

GPT和Claude可以学习公开的法律法规、判例、合同和学术资料，但一家律所真正的专业能力，并不完全存在于这些公开文本中。律所的能力还存在于一系列隐性的工作方法中：

• 如何拆解一个复杂事项

• 如何识别真正重要的风险

• 如何组织尽职调查

• 如何分配不同层级律师的任务

• 如何按照客户偏好表达结论

• 在什么情况下必须升级到合伙人判断

这些能力通常没有被完整写进一本书或者一个数据库，而是分散在邮件、批注、模板、项目复盘、客户反馈和资深律师的日常决策中。通用模型可以知道“法律是什么”，但它未必知道“这家律所如何做法律工作”。

Harvey自建模型的深层目的，是将这些工作方法转化为机器可以学习和执行的结构。未来，模型学习的将不只是最终合同或者法律意见书，还包括形成这些交付物的过程：律师先查看了哪些材料，提出了哪些问题，排除了哪些方案，为什么修改某个条款，以及最终由谁完成了复核。

这些过程数据，可以被称为“法律工作轨迹”。它比最终文书更加稀缺，也更加接近一家律所真实的专业能力。

 
  “拥有自己的智能”将改变律所的资产结构

Gabriel此次发言中最有战略意义的一句话，是让律所“拥有自己的智能”。

过去，律所最重要的资产是律师、客户关系、品牌和历史经验。但这些资产高度依附于个人。

一名合伙人离开，可能同时带走客户、经验和团队；一名资深律师退休，其积累多年的判断方法也很难被完整继承。AI提供了一种新的可能：将律所的专业能力从个人经验转化为组织资产。

如果一家律所能够把历史项目、工作流程、客户规则、审查标准和专家反馈持续沉淀到模型中，那么模型就可能成为律所知识资产的新载体。未来的律所竞争，不仅是人才数量和营业收入的竞争，也可能是专业智能资产积累速度的竞争。

同样拥有1000名律师的两家律所，一家只是让律师使用公共模型，另一家则持续把律师的工作过程转化为自有数据、评测体系和专属模型。

几年之后，两者积累的组织能力可能完全不同。前者是在消费智能，后者是在积累智能。

 
  律所真正的“秘密配方”未必是文书，而是协作关系

不过，“律所拥有自己的智能”也不能被简单理解为：每家律所都拥有大量不可复制的独门法律知识。事实上，大多数法律法规、合同结构和法律意见并非绝对秘密。交易文件会在不同市场主体之间流动，优秀做法也会被竞争对手不断学习。

律所真正难以复制的部分，往往不是某一份最终文书，而是长期形成的协作方式。例如，一家律所如何理解某个重要客户的风险偏好，如何与客户法务部门分工，哪些问题需要提前汇报，哪些条款客户绝不接受，以及不同类型事项应当由谁参与。

因此，真正适合被编码的，可能不是抽象的“律所能力”，而是更加具体的“律所—客户—事项”关系。

这种关系包含专业知识，也包含沟通习惯、组织流程和责任边界。Harvey未来最有价值的模型，可能不是一个适用于所有律所的统一法律模型，而是针对特定机构、业务领域乃至重要客户形成的专业智能版本。

 
  自建模型也是Harvey摆脱“Wrapper风险”的关键

Harvey过去的成功，很大程度上建立在调用前沿模型的基础上。但这也带来一个长期问题：如果OpenAI、Anthropic或者Google不断增强法律能力，并直接向律所提供产品，Harvey还有多少不可替代的价值？

如果Harvey只是“通用大模型加法律界面”，那么它的许多产品能力迟早可能被底层模型公司覆盖。

要摆脱这种风险，Harvey必须掌握更多法律智能的核心环节：

1. 它需要定义法律任务

2. 建立法律评测标准

3. 生产训练数据

4. 训练专业模型

5. 调度不同Agent

6. 并把模型输出转化为可以审计、复核和承担责任的法律交付物

这也是为什么Harvey近期连续开放法律Agent评测基准、研究开放权重模型的后训练效果，并建设自己的Agent基础设施。模型、数据、评测、工作流和基础设施正在被连接成一个完整体系。

当Harvey掌握这个体系，它提供的就不再只是一个调用GPT的法律软件，而是一套帮助律所生产、积累和管理专业智能的基础设施。

 
  法律AI的终局将是分层智能体系

Harvey此次宣布训练模型，也揭示了法律AI未来可能形成的基本架构。

 
      层级

      模型类型

      核心职责

      第一层

      GPT&Claude等前沿通用模型

      负责复杂推理、未知问题和最高难度任务

      第二层

      Harvey这样的法律基础模型

      负责法律研究、文件分析、工作流执行和工具调用

      第三层

      律所、企业和政府机构的专属模型

      负责学习各自的知识、规则、流程和专业偏好

层级	模型类型	核心职责
第一层	GPT&Claude等前沿通用模型	负责复杂推理、未知问题和最高难度任务
第二层	Harvey这样的法律基础模型	负责法律研究、文件分析、工作流执行和工具调用
第三层	律所、企业和政府机构的专属模型	负责学习各自的知识、规则、流程和专业偏好

在这套体系中，真正重要的并不是某一个模型独立完成所有工作，而是不同模型、工具、数据和人类专家之间的协同。

未来最强的法律AI公司，未必拥有全世界最强的通用模型，但它必须知道如何把不同层次的智能组织起来，形成稳定、可信、可规模化的法律生产能力。

 
  结语：从租用智能，到积累智能

Harvey开始训练自己的法律模型，表面上看是一项技术选择，实际上是一次商业模式和产业定位的升级。在法律AI发展的早期，应用公司最合理的策略，是调用最强的外部模型，快速形成产品和市场。

但当AI开始进入真实项目、复杂流程和大规模组织之后，仅仅调用模型已经不够。企业必须进一步控制成本、安全、数据、工作流程和专业能力的沉淀方式。

Harvey正在从“使用谁的模型”，走向“谁拥有由模型形成的专业智能”。

这可能是法律AI下一阶段最重要的竞争分水岭：一些公司继续销售AI工具，另一些公司则开始帮助律所把知识、经验和工作流程转化为长期积累的智能资产。当法律AI从回答问题走向完成事项，模型便不再只是外部采购的技术原料。它开始成为律所的生产资料、组织记忆和核心资产。

Harvey真正想做的，不只是让每一家律所使用人工智能。而是让每一家律所，拥有自己的智能。

-end-

【声明】内容源于网络

智合AI公众号

智合AI 法律人一站式助手

内容 140

粉丝 0

智合AI公众号智合AI 法律人一站式助手

总阅读1.2k

粉丝0

内容140