Anthropic把律所搬进了Claude，我看了一整夜，审计可以直接抄

nigo

2026-05-14 约 2826 字预计阅读 6 分钟

Anthropic 新开源了一个项目，叫 claude-for-legal，火了一把。

简单说就是——把律师事务所搬进了 Claude Code。 11个法律业务领域，60多个专用Agent，合同审查、尽职调查、诉讼管理、知识产权……律师日常干的活，全拆成了一个个能直接调用的Agent。

律师事务所是专业服务机构，会计师事务所也是。同行抄作业，天经地义。

律所搬进Claude长什么样

先说这个项目做了什么。

Anthropic 做了一件事：把律师事务所的日常业务拆成了11个插件，每个插件覆盖一个法律实务领域。

11个领域，60多个 Agent，涵盖了：

插件	做什么
commercial-legal	供应商合同审查、NDA分类、续约监控
corporate-legal	M&A尽职调查、交割清单、董事会决议
privacy-legal	DPA审查、DSAR响应、隐私影响评估
litigation-legal	案件管理、诉求图表、证言准备
ip-legal	商标查重、FTO初筛、侵权分析
employment-legal	招聘/解雇审查、用工分类、内部调查
……	……

这不是一个"通用法律AI助手"。

是60多个专用的、有名字的 Agent。 每个 Agent 只干一件事，但干得很精。

比如合同审查这件事，它不是笼统的"帮我看看这份合同"，而是拆成了：

Vendor Agreement Reviewer — 按你的 playbook 审查供应商合同，输出 redline 备忘录
NDA Triager — 把收到的 NDA 分成绿/黄/红三档，只有红色才需要律师亲自看
Amendment Tracer — 追踪一份合同从原始版本到历次修订的所有变化
Renewal Watcher — 后台自动扫描合同到期日，提前预警

看到这里你可能会想：这不就是我们审计想干的事吗？

把一个大流程拆成一堆小任务，每个任务交给专门的 Agent，后台自动跑。

是。但真正让我看了一整夜的，不是这些 Agent 本身，而是它们背后的架构设计。

三个让这个项目成立的设计

设计一：冷启动面试

这是整个项目最精妙的部分。

每个插件安装之后，不会直接开始干活。它会先跟你做一次结构化访谈，大概10-20分钟：

你们怎么审查合同的？

给我一份你们做过的审查备忘录当模板

你们的升级规则是什么？什么情况需要合伙人审批？

你们用什么合同管理系统？

访谈结束后，它把你的方法论、模板、偏好写成一份 CLAUDE.md 实务档案。

后续所有 Agent 都读这份档案。

这意味着：同一个插件，A律所和B律所安装后，行为完全不同——因为它们的方法论不同。

设计二：共享上下文，不是串联流程

我之前一直觉得"串流程"需要做一个大的编排引擎，像工作流软件一样。

但 claude-for-legal 的做法完全不同。

它不串流程。它串上下文。

每个 Agent 是独立的，但它们都从同一份 CLAUDE.md 读取信息。CLAUDE.md 就是那个"串联点"——你不需要显式地连接它们，共享的方法论档案自然就让他们对齐了。

┌──────────────────────────────┐
│  CLAUDE.md（实务档案）         │
│  - 方法论                     │
│  - 模板                       │
│  - 风险偏好                   │
│  - 升级规则                   │
├──────────────────────────────┤
│                                │
│  Agent A  Agent B  Agent C     │
│  （各自独立，都读 CLAUDE.md）   │
│                                │
├──────────────────────────────┤
│  Connector（连接外部系统）     │
│  合同管理系统 / 法院系统 / ... │
└──────────────────────────────┘

这个设计很妙。你加一个新的 Agent，不用改任何已有的东西，只要让它也读 CLAUDE.md 就行。

设计三：输出永远是草稿

每个 Agent 的输出都标注：DRAFT — 需律师审核。

不是法律意见，不是法律结论，不能替代律师。

引用必须标注来源。如果没连上法律数据库，引用会标记 [verify]，提醒你这条没有经过验证。

关键决策点设"门"（gate）： 自动处理到某一步，必须由人确认才能继续。

映射到审计：一套可以抄的架构

法律和审计的相似度比很多人想的高：

	法律	审计
交付物	法律意见书、备忘录	审计报告、审计底稿
流程	尽调→审查→出意见	计划→执行→完成
风险	法律责任	审计风险
数据来源	法院系统、合同库	财务系统、凭证库
专业判断	律师	注册会计师

所以 Anthropic 这套架构，几乎可以直接映射到审计。

冷启动 = 审计计划

律师的冷启动面试，本质上就是我们审计的计划阶段。

审计项目开始时你要做什么？

了解被审计单位及其环境
评估重大错报风险
确定重要性水平
制定总体审计策略

这些信息，完全可以写成一个 audit-setup 的冷启动 skill：

/audit:cold-start

→ 访谈问题：

客户行业？上市/非上市？报告类型？

上年审计的关键事项？

重要性水平怎么算？

审计软件用什么？数据在哪？

请提供：上年审计报告、本期未审报表

→ 输出：项目级 CLAUDE.md

这份 CLAUDE.md 就是整个审计项目的共享上下文。 后续所有 Agent 都知道这个项目的基本情况，不用每次重复输入。

按阶段拆 Agent

法律项目按业务领域拆插件。审计可以按阶段拆：

计划阶段

Agent	做什么
client-acceptance	客户承接评价（独立性、诚信评估）
risk-assessment	风险识别与评估
materiality-calc	重要性水平计算与分配
audit-plan	生成审计计划

执行阶段

Agent	做什么
analytical-procedures	分析性复核（波动分析、比率分析）
voucher-check	凭证抽查（记账凭证→原始凭证核对）
bank-confirmation	银行函证生成、追踪、差异处理
related-party	关联方识别与交易审查
revenue-testing	收入循环测试

完成阶段

Agent	做什么
going-concern	持续经营评估
audit-summary	审计总结
management-letter	管理建议书起草
audit-report	审计报告起草

每个 Agent 从 CLAUDE.md 读项目上下文，输出审计底稿草稿，标注需项目经理复核。

后台 Agent 自动跑

法律项目有一堆 scheduled agent：合同到期监控、法院案件更新、法规变化摘要。

审计的对应物更刚需：

后台Agent	频率	做什么
confirmation-tracker	每天	追踪函证回函状态，超期预警
deadline-watcher	每天	报告日期倒计时，关键节点提醒
client-news-monitor	每周	监控客户舆情/公告/处罚信息

这些东西不需要人盯着，后台跑就行。

信任层：审计比法律更需要

法律项目每个输出都标"草稿，需律师审核"。

审计？必须比这更严格。

AI 输出的每个判断都需要标注：

数据来源（哪个底稿、哪个系统）
置信度
关键节点的"门"——重要性水平要高级经理确认，审计意见类型要合伙人确认

这不是限制 AI 的能力，是保护注册会计师。

怎么开始：三步走

看完这个项目，我理出了一条可以落地的路径。

第一步：搭架子

不用一口气做 60 个 Agent。先搭好结构：

audit-plugin/
  CLAUDE.md                ← 审计方法档案（模板）
  skills/
    cold-start-interview/  ← 项目初始化
    materiality-calc/      ← 重要性水平计算
    voucher-check/         ← 凭证抽查
    analytical-procedures/ ← 分析性复核
  agents/
    confirmation-tracker/  ← 函证追踪
  .mcp.json               ← 连接审计工具

第二步：一个 Agent 做透

选一个最痛的场景，做到极致。

凭证抽查、分析性复核、函证追踪，哪个最让你头疼，就从那个开始。

关键是：

定义好判断逻辑（什么情况自动处理，什么情况停下来问人）
接上数据源（科目余额表、明细账、凭证库）
在一个项目上跑通

第三步：靠 CLAUDE.md 串起来

一个 Agent 验证可行之后，再加新的。

每个新 Agent 都从 CLAUDE.md 读项目上下文，自然就协作了。你不需要设计一个大流程引擎，共享的上下文就是串联。

这就是 claude-for-legal 最核心的洞察：

不要试图串流程，要串上下文。

一句话

Anthropic 没有做一个"万能法律AI"，它做的是一套让律师的方法论变成AI的行为规范的基础设施。

审计也一样。我们缺的不是 AI 能力，是把审计方法论翻译成AI能理解的语言的中间层。

claude-for-legal 给了一个参考答案。开源的，Apache 2.0 协议，可以直接看代码。

项目地址：https://github.com/anthropics/claude-for-legal

目录