14k⭐，Anthropic用60KB纯文本让Claude变成审计专家

nigo 收录于工作

2026-05-25 约 3711 字预计阅读 8 分钟

上周用Claude Code写了个关联方识别的Skill，跑了一遍12个维度的自动核查，效果还不错。

但这几天GitHub上出现了一个更有意思的东西——Anthropic自己下场了。

他们开源了一套叫 knowledge-work-plugins 的项目，给Claude装上了11个职业角色插件。销售、法务、财务、产品经理……每个插件把一个岗位的专业知识、工作流程、工具连接全部打包好，装上就能用。

其中有一个 finance 插件，直接覆盖了审计和财务的工作场景。

14k⭐，一周不到。

这个插件到底是什么

先说清楚它不是什么。

它不是一个App，不是一个网站，也不是一个SaaS产品。

它是一堆 markdown文件。

对，就是跟你平时写笔记一样的markdown。只不过这些markdown里装的是专业知识——怎么做凭证、怎么做银行对账、怎么做SOX测试、怎么做差异分析。

Claude读了这些文件，就变成了一个懂财务和审计的助手。

这跟我们现在用的Skill本质上是一回事。只不过Anthropic把它标准化了，给了一套固定的目录结构。

架构：三层设计

每个插件由三部分组成：

第一层：Skills（技能）

核心知识层。每个技能是一个SKILL.md文件，包含某个工作领域的完整方法论。

finance插件目前有8个技能：

技能	干什么
audit-support	SOX 404控制测试、抽样方法、缺陷分类
reconciliation	银行对账、GL与子账核对、关联方对账
journal-entry	凭证准备——应计、折旧、预摊、薪酬、收入
journal-entry-prep	凭证编制最佳实践和审核流程
financial-statements	财务报表生成（利润表、资产负债表、现金流量表）
variance-analysis	差异分析——价格/量、利率/组合分解
close-management	月末结账检查清单和任务排期
sox-testing	SOX合规测试——样本选取、测试底稿模板

Claude会根据你问的问题，自动匹配相关的技能文件来辅助回答。

第二层：Commands（命令）

你可以用斜杠命令直接触发特定操作：

/journal-entry ap-accrual 2026-03 — 自动生成AP应计凭证
/reconciliation cash 2026-03 — 执行银行对账
/sox-testing revenue-recognition 2026-Q1 — 生成收入确认控制测试底稿
/variance-analysis revenue 2026-Q1 vs 2025-Q4 — 收入差异分解
/income-statement monthly 2026-03 — 生成月度利润表

每个命令后面跟的是参数，告诉Claude具体要处理什么。

第三层：Connectors（连接器）

通过MCP协议连接外部数据源。配置写在 .mcp.json 里：

Snowflake → 数据仓库，直接拉科目余额
BigQuery → 查询财务数据
Slack → 发送报告、催审批
Microsoft 365 → Excel、Outlook

连上之后，Claude可以直接从你的ERP里拉试算平衡表，自动生成凭证，再把结果发到Slack上。

不连也行，手动粘贴数据一样能用。

实际跑一个：银行存款审计程序

光说架构没意思，来个具体场景。

假设我正在做一个年审项目，需要做银行存款的审计程序。

第一步：对账

输入：

/reconciliation cash 2026-03

Claude会按照reconciliation技能里的方法论，走完整个银行对账流程：

银行对账单余额：      ¥12,345,678.90
加：在途存款          ¥234,567.80
减：未兑现支票        (¥156,789.00)
加/减：银行差错        ¥0.00
调整后银行余额：      ¥12,423,457.70

账面余额：            ¥12,400,000.00
加：银行利息未入账    ¥23,457.70
减：银行手续费未入账  (¥0.00)
调整后账面余额：      ¥12,423,457.70

差异：                ¥0.00 ✅

它还会告诉你哪些是常见差异原因——手动凭证没过子账、批次过账时间差、系统接口错误。

第二步：控制测试

输入：

/sox-testing treasury 2026-Q1

Claude按照sox-testing技能生成完整的控制测试底稿：

识别关键控制——列出资金管理相关的控制点
确定样本量——按控制频率（日/周/月）给出抽样表
选取样本——随机、系统、定向三种方法
生成测试模板——每个样本的测试步骤和预期证据
缺陷分类——不足、重要不足、重大缺陷三个等级

它甚至会告诉你什么是充分证据、什么是不充分证据：

✅ 截图、签字审批、邮件确认、系统审计日志 ❌ 单纯口头确认、无日期文档、无操作人记录

第三步：差异分析

输入：

/variance-analysis cash 2026-Q1 vs 2025-Q4

Claude把差异拆解成驱动因素——价格/量、利率/组合，生成瀑布图数据，附上文字解释。

第四步：生成凭证

输入：

/journal-entry prepaid 2026-03

如果连上了ERP，它会自动拉试算平衡表和预付摊销明细，生成：

凭证：预付费用摊销 — 2026年3月
编制人：Claude    日期：2026-03-31

| 行 | 科目编码 | 科目名称   | 借方    | 贷方    |
|----|---------|-----------|---------|---------|
| 1  | 6601    | 保险费     | 12,000  |         |
| 2  | 6602    | 软件费     | 8,500   |         |
| 3  | 1801    | 预付保险费 |         | 12,000  |
| 4  | 1802    | 预付软件费 |         | 8,500   |
|    |         | **合计**   | 20,500  | 20,500  |

这套架构的精髓

看完上面这个流程，你可能觉得：这不就是让AI按步骤执行吗？

对。但关键不在于步骤本身，而在于知识是怎么被组织起来的。

每个SKILL.md文件其实就干了三件事：

定义触发条件——什么情况下该用这个技能（通过frontmatter里的description）
编码专业知识——把审计方法论、会计准则、最佳实践写进markdown
给出执行模板——输出格式、工作底稿模板、判断标准

这意味着你可以完全自定义。

Anthropic写的是SOX框架、GAAP准则、美国审计方法论。但目录结构是开放的——你fork一份，把中国的审计准则、企业会计准则、你的所内方法论塞进去，就变成了一个中国审计专用插件。

从单个场景到审计全流程：还有多远

finance插件展示了「知识编码」的可行性。但如果想在真实的国内审计项目里跑起来，光fork一份改改内容是不够的。

差距在哪？

第一，准则体系完全不同。

插件里写的是SOX 404、GAAP、COSO框架。中国审计用的是企业会计准则、中国注册会计师审计准则。两套体系的概念框架、术语体系、判断标准都不一样。

这不是翻译问题，是重写。

比如审计抽样——插件里用的是AICPA的抽样表，中国审计准则第1314号有自己的抽样逻辑和样本量要求。每个SKILL.md都得按中国准则重新组织。

第二，数据接不上。

插件的连接器指向Snowflake、BigQuery、Slack——这些都是美国企业的标准技术栈。

国内审计项目的现实是什么？

客户给你的是一堆Excel。科目余额表、明细账、银行对账单，全在Excel里。有的还是PDF扫描件。甚至还有纸质盖章的。

MCP连接器得换成能读Excel、读PDF、接企业微信/钉钉的。这个技术上有解决方案，但每个客户的系统都不一样，适配成本不低。

第三，审计流程远比财务流程复杂。

finance插件覆盖的是财务闭环——凭证、对账、报表、差异分析。这些是结构化的、流程化的，适合用技能文件来编码。

但审计的核心不是执行流程，是判断。

风险评估阶段，你得判断这个客户的收入有没有重大错报风险。这个判断取决于你对行业的理解、对管理层的评估、对经营环境的感知。这些东西很难写成SKILL.md里的规则。

实质性程序阶段更复杂。函证回函率不够怎么办？替代程序怎么选？发现的差异是调整项还是可接受误差？每个判断都依赖项目经验。

第四，底稿标准和质量控制。

每个事务所有自己的底稿模板、复核流程、质控标准。SKILL.md里输出的格式，不可能恰好匹配你所用所的要求。

更关键的是责任问题。AI生成的审计工作底稿，谁来签字？出了问题谁负责？目前这个插件在每个SKILL.md开头都写了一句话：

This skill assists with workflows but does not provide audit advice. All outputs should be reviewed by qualified professionals.

这行免责声明说明Anthropic自己也很清楚——现阶段它只能当助手，不能当审计师。

第五，数据安全和保密。

审计数据包含客户的核心财务信息。把科目余额表发给Claude，等于把客户的家底上传到Anthropic的服务器。

国内监管对数据出境有严格要求。大型审计项目的数据，大概率不能直接用云端AI处理。

（注：但可以借鉴用私有算力，开源 agent 工具实现）

落地路径

说了这么多差距，不代表这事做不了。只是说需要一个务实的路径：

先把知识层建起来。不考虑自动化，就按审计准则把每个环节的方法论、判断标准、底稿模板写进SKILL.md。这本身就是对所内知识体系的标准化——很多事务所连这个都没做完
从数据输入端解决。不指望直接连ERP，先把「给AI一堆Excel它能读、能算、能生成底稿」这件事跑通
选择性地自动化。别上来就想全流程自动化。银行对账、凭证生成、差异分析这些规则性强的环节先做，风险评估、职业判断这些先留给人
本地化部署。用本地模型或者私有化部署解决数据安全问题。Claude Code支持第三方模型，这块是可以绕过去的

怎么装

在Claude Code里两行命令：

# 先添加插件市场
claude plugin marketplace add anthropics/knowledge-work-plugins

# 安装finance插件
claude plugin install finance@knowledge-work-plugins

装完自动生效。不用配置，不用写代码。

如果想自定义，fork到自己的GitHub仓库，改SKILL.md里的内容，重新安装就行。

写在最后

这个插件加起来大概 60多KB 的markdown文件，没有一行代码。

但它的意义不在于能立刻帮你跑完一个审计项目。说实话，离那个目标还有不小的距离。

它的意义在于展示了一种可能性：审计知识是可以被结构化、被复用、被持续迭代的。

在这之前，让AI懂审计的门槛是「训练一个审计领域的专业模型」。微调、数据标注、算力成本，光是想想就劝退了99%的事务所。

现在Anthropic把这个门槛降到了「写好你的审计方法论」。

把你的所内手册、审计准则理解、判断标准写进markdown文件，AI就能按你的方式干活。

这60KB不是终点。但它可能是一个起点。