Anthropic把律所搬进了Claude,我看了一整夜,审计可以直接抄
Anthropic 新开源了一个项目,叫 claude-for-legal,火了一把。
简单说就是——把律师事务所搬进了 Claude Code。 11个法律业务领域,60多个专用Agent,合同审查、尽职调查、诉讼管理、知识产权……律师日常干的活,全拆成了一个个能直接调用的Agent。
律师事务所是专业服务机构,会计师事务所也是。同行抄作业,天经地义。

律所搬进Claude长什么样

先说这个项目做了什么。
Anthropic 做了一件事:把律师事务所的日常业务拆成了11个插件,每个插件覆盖一个法律实务领域。
11个领域,60多个 Agent,涵盖了:
| 插件 | 做什么 |
|---|---|
| commercial-legal | 供应商合同审查、NDA分类、续约监控 |
| corporate-legal | M&A尽职调查、交割清单、董事会决议 |
| privacy-legal | DPA审查、DSAR响应、隐私影响评估 |
| litigation-legal | 案件管理、诉求图表、证言准备 |
| ip-legal | 商标查重、FTO初筛、侵权分析 |
| employment-legal | 招聘/解雇审查、用工分类、内部调查 |
| …… | …… |
这不是一个"通用法律AI助手"。
是60多个专用的、有名字的 Agent。 每个 Agent 只干一件事,但干得很精。
比如合同审查这件事,它不是笼统的"帮我看看这份合同",而是拆成了:
- Vendor Agreement Reviewer — 按你的 playbook 审查供应商合同,输出 redline 备忘录
- NDA Triager — 把收到的 NDA 分成绿/黄/红三档,只有红色才需要律师亲自看
- Amendment Tracer — 追踪一份合同从原始版本到历次修订的所有变化
- Renewal Watcher — 后台自动扫描合同到期日,提前预警
看到这里你可能会想:这不就是我们审计想干的事吗?
把一个大流程拆成一堆小任务,每个任务交给专门的 Agent,后台自动跑。
是。但真正让我看了一整夜的,不是这些 Agent 本身,而是它们背后的架构设计。
三个让这个项目成立的设计

设计一:冷启动面试
这是整个项目最精妙的部分。
每个插件安装之后,不会直接开始干活。它会先跟你做一次结构化访谈,大概10-20分钟:
- 你们怎么审查合同的?
- 给我一份你们做过的审查备忘录当模板
- 你们的升级规则是什么?什么情况需要合伙人审批?
- 你们用什么合同管理系统?
访谈结束后,它把你的方法论、模板、偏好写成一份 CLAUDE.md 实务档案。
后续所有 Agent 都读这份档案。
这意味着:同一个插件,A律所和B律所安装后,行为完全不同——因为它们的方法论不同。
设计二:共享上下文,不是串联流程
我之前一直觉得"串流程"需要做一个大的编排引擎,像工作流软件一样。
但 claude-for-legal 的做法完全不同。
它不串流程。它串上下文。
每个 Agent 是独立的,但它们都从同一份 CLAUDE.md 读取信息。CLAUDE.md 就是那个"串联点"——你不需要显式地连接它们,共享的方法论档案自然就让他们对齐了。
┌──────────────────────────────┐
│ CLAUDE.md(实务档案) │
│ - 方法论 │
│ - 模板 │
│ - 风险偏好 │
│ - 升级规则 │
├──────────────────────────────┤
│ │
│ Agent A Agent B Agent C │
│ (各自独立,都读 CLAUDE.md) │
│ │
├──────────────────────────────┤
│ Connector(连接外部系统) │
│ 合同管理系统 / 法院系统 / ... │
└──────────────────────────────┘
这个设计很妙。你加一个新的 Agent,不用改任何已有的东西,只要让它也读 CLAUDE.md 就行。
设计三:输出永远是草稿
每个 Agent 的输出都标注:DRAFT — 需律师审核。
不是法律意见,不是法律结论,不能替代律师。
引用必须标注来源。如果没连上法律数据库,引用会标记 [verify],提醒你这条没有经过验证。
关键决策点设"门"(gate): 自动处理到某一步,必须由人确认才能继续。
映射到审计:一套可以抄的架构

法律和审计的相似度比很多人想的高:
| 法律 | 审计 | |
|---|---|---|
| 交付物 | 法律意见书、备忘录 | 审计报告、审计底稿 |
| 流程 | 尽调→审查→出意见 | 计划→执行→完成 |
| 风险 | 法律责任 | 审计风险 |
| 数据来源 | 法院系统、合同库 | 财务系统、凭证库 |
| 专业判断 | 律师 | 注册会计师 |
所以 Anthropic 这套架构,几乎可以直接映射到审计。
冷启动 = 审计计划
律师的冷启动面试,本质上就是我们审计的计划阶段。
审计项目开始时你要做什么?
- 了解被审计单位及其环境
- 评估重大错报风险
- 确定重要性水平
- 制定总体审计策略
这些信息,完全可以写成一个 audit-setup 的冷启动 skill:
/audit:cold-start
→ 访谈问题:
- 客户行业?上市/非上市?报告类型?
- 上年审计的关键事项?
- 重要性水平怎么算?
- 审计软件用什么?数据在哪?
- 请提供:上年审计报告、本期未审报表
→ 输出:项目级 CLAUDE.md
这份 CLAUDE.md 就是整个审计项目的共享上下文。 后续所有 Agent 都知道这个项目的基本情况,不用每次重复输入。
按阶段拆 Agent
法律项目按业务领域拆插件。审计可以按阶段拆:
计划阶段
| Agent | 做什么 |
|---|---|
| client-acceptance | 客户承接评价(独立性、诚信评估) |
| risk-assessment | 风险识别与评估 |
| materiality-calc | 重要性水平计算与分配 |
| audit-plan | 生成审计计划 |
执行阶段
| Agent | 做什么 |
|---|---|
| analytical-procedures | 分析性复核(波动分析、比率分析) |
| voucher-check | 凭证抽查(记账凭证→原始凭证核对) |
| bank-confirmation | 银行函证生成、追踪、差异处理 |
| related-party | 关联方识别与交易审查 |
| revenue-testing | 收入循环测试 |
完成阶段
| Agent | 做什么 |
|---|---|
| going-concern | 持续经营评估 |
| audit-summary | 审计总结 |
| management-letter | 管理建议书起草 |
| audit-report | 审计报告起草 |
每个 Agent 从 CLAUDE.md 读项目上下文,输出审计底稿草稿,标注需项目经理复核。
后台 Agent 自动跑
法律项目有一堆 scheduled agent:合同到期监控、法院案件更新、法规变化摘要。
审计的对应物更刚需:
| 后台Agent | 频率 | 做什么 |
|---|---|---|
| confirmation-tracker | 每天 | 追踪函证回函状态,超期预警 |
| deadline-watcher | 每天 | 报告日期倒计时,关键节点提醒 |
| client-news-monitor | 每周 | 监控客户舆情/公告/处罚信息 |
这些东西不需要人盯着,后台跑就行。
信任层:审计比法律更需要
法律项目每个输出都标"草稿,需律师审核"。
审计?必须比这更严格。
AI 输出的每个判断都需要标注:
- 数据来源(哪个底稿、哪个系统)
- 置信度
- 关键节点的"门"——重要性水平要高级经理确认,审计意见类型要合伙人确认
这不是限制 AI 的能力,是保护注册会计师。
怎么开始:三步走

看完这个项目,我理出了一条可以落地的路径。
第一步:搭架子
不用一口气做 60 个 Agent。先搭好结构:
audit-plugin/
CLAUDE.md ← 审计方法档案(模板)
skills/
cold-start-interview/ ← 项目初始化
materiality-calc/ ← 重要性水平计算
voucher-check/ ← 凭证抽查
analytical-procedures/ ← 分析性复核
agents/
confirmation-tracker/ ← 函证追踪
.mcp.json ← 连接审计工具
第二步:一个 Agent 做透
选一个最痛的场景,做到极致。
凭证抽查、分析性复核、函证追踪,哪个最让你头疼,就从那个开始。
关键是:
- 定义好判断逻辑(什么情况自动处理,什么情况停下来问人)
- 接上数据源(科目余额表、明细账、凭证库)
- 在一个项目上跑通
第三步:靠 CLAUDE.md 串起来
一个 Agent 验证可行之后,再加新的。
每个新 Agent 都从 CLAUDE.md 读项目上下文,自然就协作了。你不需要设计一个大流程引擎,共享的上下文就是串联。
这就是 claude-for-legal 最核心的洞察:
不要试图串流程,要串上下文。
一句话
Anthropic 没有做一个"万能法律AI",它做的是一套让律师的方法论变成AI的行为规范的基础设施。
审计也一样。我们缺的不是 AI 能力,是把审计方法论翻译成AI能理解的语言的中间层。
claude-for-legal 给了一个参考答案。开源的,Apache 2.0 协议,可以直接看代码。
项目地址:https://github.com/anthropics/claude-for-legal