在财务团队里,最贵的不是算错一张表,而是同一份数字在三版 deck、两个 spreadsheet 和五轮 review 里被讲成了三个版本的故事。

Anthropic 最近分享了他们内部财务团队如何使用 Claude:不是拿来“写一段话”这么简单,而是把它放进一个更关键的位置上,做叙事一致性校验、模型审计、月度复盘草稿生成,让财务人把时间花在判断和沟通上,而不是反复校对口径。

这篇文章我不做逐句翻译,只提炼一个核心结论:Claude 在财务场景里最有价值的能力,不是写,而是把“数字正确”和“故事正确”同时守住。

先看结论:财务团队真正需要的是叙事层的“单一事实源”

财务工作天然有两个层面。

第一层是数字层,强调准确、可追溯、可复核。

第二层是叙事层,强调解释变化、对齐预期、连接经营和战略。

大多数团队的问题,不是没有数据,而是这两层经常脱节。数字更新得很快,叙事跟不上;叙事写得很顺,但和最新模型、最新假设、最新 slide 对不上。

Claude 的定位,就是把这两个层面重新焊接起来。

这不是“自动写报告”,而是“自动做一致性守门员”

Anthropic 财务团队给 Claude 的任务,核心不是生成内容,而是:

  • 检查 deck 里的每个数字和主张是否指向同一个 truth source
  • 阅读整份材料,站在 board member 的视角找自相矛盾之处
  • 在模型变化后,快速重建 narrative baseline
  • 在 monthly review 里生成 first pass,再由人做判断和定稿

换句话说,Claude 负责的是“前置校验 + 初稿生成 + 语义一致性检查”。

这是一个很适合 LLM 的位置,因为它比规则引擎更懂上下文,比人工更适合高频重复。

Claude 在财务工作流里的位置

先把这个工作流抽象成一张图:

flowchart LR
    A[财务模型 / spreadsheet] --> B[Claude for Excel]
    C[Board deck / Google Doc] --> D[Claude Cowork]
    B --> E[数字校验 / 异常定位]
    D --> F[叙事一致性 / first draft]
    E --> G[财务分析师]
    F --> G
    G --> H[给 CFO / Board 的最终材料]

你会发现,Claude 并不是坐在“最终输出”的位置上,而是在“输出前的反复校验”里发挥作用。

这点非常关键。

如果把财务材料的生产过程看成一条流水线,最耗时的通常不是“最后写一句话”,而是:

  • 数字刷新后重跑校验
  • 叙事要跟着每次刷新重新对齐
  • 各部门同时改 slide,导致口径漂移
  • 旧的解释还没删,新的假设又插进来了

Claude 擅长的恰好就是这类高频、结构化、需要上下文的工作。

为什么 board deck 特别适合 Claude

Anthropic 的案例里,最典型的是 quarterly board deck。

在这个场景里,财务分析师不是一次性写完就结束,而是要面对持续变化:

  • 数字会一直刷新到交付前一刻
  • 合作方会同时改自己的 slide
  • 评论文字必须和新的数值保持一致
  • 某个指标一旦没有定义清楚,就会把整份 deck 的逻辑链条拉断

这时候 Claude 的作用不是“补一句漂亮话”,而是做三件很实际的事。

1. 对齐数字和叙事

Claude Cowork 会先看文档,再检查文档里的每个数字、每个 claim 是否还能对上单一事实源。

2. 从 board member 角度读材料

这很重要。你自己写 deck,容易默认一些上下文是“大家都知道”的。

Claude 会逼你把这些默认值显式化:

  • 这个变化是谁导致的?
  • 这个增长和产品发布之间是什么关系?
  • 这个口径是不是和上一页冲突?

3. 数字一变,叙事就自动重新审视

人脑很难在多轮更新后始终保持全局一致性。

Claude 擅长的就是这种“每次改动都重新读一遍”的机械劳动。

月度财务复盘:Claude 更像一个初稿合伙人

另一个高频场景是 monthly review。

Anthropic 的做法不是让 Claude 直接替代分析师,而是让它先写 first pass:

  1. 把相关的财务表格放进文档
  2. 链接支持上下文
  3. 让 Claude 按既有语气生成 variance analysis
  4. 人再做最后校正

这种方式的好处是,团队的写作风格会更一致。

财务叙事不是创意写作,最怕每个月换一个语气。今天像市场部,明天像法务部,后天像 CEO 口播稿。

Claude 的价值在于,它可以参考上个月的文档,保持同一套表达习惯:

  • revenue was A versus B
  • off by C%
  • driven by D

这类句式看起来普通,但在高频汇报里,普通就是生产力。

Claude for Excel 的意义:把“查错”从人工转成协作

文章里还有一个细节很值得注意:Claude for Excel 的能力提升,不只是“能看表”,而是能追踪跨 sheet 的引用链,帮你定位 balance sheet 为什么不平。

这意味着什么?

意味着财务团队里最烦的那类问题开始可以被半自动化处理:

  • 某个单元格引用了旧版本
  • 某张表的假设和主表不一致
  • 某个 balance sheet 失衡但源头藏在多个 tab 后面

你可以把它理解成一个“结构化的排错助手”。

它不替你做判断,但它能把问题缩小到足够具体,让专家真正开始做判断。

一个很实用的提示模板

如果你也想把类似的流程搬到自己的财务或运营团队,可以先从这种提示开始:

请检查这份 board deck:
1. 找出所有和数字不一致的叙事句子
2. 标记未定义的指标
3. 检查 slide 之间是否存在口径冲突
4. 用 board member 能看懂的方式总结风险点

这个提示不神秘,但很有效。

因为它把 LLM 的任务从“自由发挥”改成了“受约束的审校”。

这套方法为什么有效

我认为它有效,不是因为 Claude “会写”,而是因为它同时满足了三个条件。

1. 上下文足够稳定

财务材料的结构相对稳定,board deck、monthly review、model audit 都有固定模板。

LLM 很怕完全无结构的开放式任务,但很适合在有模板的场景里做增量增强。

2. 质量标准足够明确

财务工作不是“好不好看”,而是:

  • 是否与模型一致
  • 是否可追溯
  • 是否能对 board 解释清楚

这类标准非常适合让 AI 做辅助检查。

3. 人类判断依然是最后一道门

Anthropic 的案例没有把 Claude 描述成“自动决策者”,而是把它放在前置审阅和初稿生成的位置。

这很健康。

因为财务不是一个可以把责任完全外包给模型的领域,模型负责提速,人负责负责。

对企业团队的启发

如果你在做企业 AI 落地,这篇文章给了一个很实际的启发:先找“高频、结构化、对一致性敏感”的环节,而不是先找最炫的环节。

财务团队就是典型样本。

你不需要一上来就做一个“全自动财务代理人”。你只需要先做三件事:

  • 让模型审校 board deck 的叙事一致性
  • 让模型辅助 monthly review 的 first draft
  • 让模型帮你追踪模型和 spreadsheet 的异常

这三件事叠加起来,就已经能省掉一大块重复劳动。

小结

Anthropic 财务团队这篇文章最值得学的,不是“他们也在用 Claude”,而是他们把 Claude 放在了正确的位置上。

不是最终裁决者,不是花里胡哨的写手,而是:

  • 数字和叙事之间的校验层
  • 模型和汇报之间的缓冲层
  • 高价值判断前的降噪层

这才是企业里最现实的 AI 用法。

参考资料:

欢迎关注收藏我,获取更多硬核技术干货