OpenClaw 大火，审计同事花两周养的“虾”，做了两个核心功能全翻车

type

Post

status

Published

date

Apr 1, 2026 09:06 AM

slug

content-5f8e7a0a-8b0f-4a1e-bc6e-0f6f6c9c1f7a

summary

在这篇文章中，审计同事的“龙虾”项目遭遇了重大失败，原计划通过AI实现票据识别和财务明细自动填表，但实际上两项核心功能都无法正常运作。图片识别因材料复杂性导致识别率低下，而在填表过程中，非标准化的数据格式和缺乏判断能力使得自动化变得困难。最终，团队决定放弃执行层的尝试，转而利用AI进行审核，重点检查底稿是否满足程序要求。这一转变使得审计流程更为高效，同时也让团队意识到，核实数字的判断仍需依赖人类的经验与直觉。

先卡住的是”图片识别“

他的第一个想法并不复杂：把客户发来的凭证、流水、发票图片交给小龙虾，再用文字一步步告诉它该用什么工具、什么技能，就像平时带实习生一样。先把照片发给指定工具做识别，再按约定格式输出，最后按正确格式填进对应表格。但审计现场拿到的材料很少规整。可能是盖着公章、压住数字的银行流水，也可能是客户斜着拍的发票，或者手写和打印混在一起的老凭证。

材料一复杂，识别率就往下掉。财务数据特别细碎，模型的容错率很低。识别率只有八成，剩下那两成就得逐行复核。算下来，成本往往比手工录入还高。更麻烦的是，AI会认字，却不一定懂财务逻辑。它可能把“价税合计”当成“本金”。没有专业校验规则托底，根本没法用。可真正让他停下来的，还在后面。

填表难的不是动作，是判断

图片识别没跑通，他又去试第二步：把提取出的数据自动匹配，再填进Excel底稿。这一步看着像搬运，做起来却不是。先碰到的是“非标”。不同客户的发过来的科目体系不一样，不同行业的底稿格式不一样，同一家客户不同年度的表也可能改。测试的时候里勉强跑通的规则，一到真实场景或者换个客户就失效。但更难的不是格式，而是判断。填底稿，并不是把数字填进行就可以了的。比如一笔5000元的“办公用品”报销，AI自然直接归进管理费用。可有要是人会翻下附件、看背景，再判断它到底该进哪一类。搞不好是招待费，或者是员工福利。

而且小龙虾有一个很要命的问题：它的执行路径是线性的。就算你让它重新检查，前面的错误依然会循环影响后面的结论。一步错，后续就会步步错。它不会自己停下来，也不会主动怀疑。

而人很多时候会不断自省，一旦发现错误就会及时纠正，不会一直错下去。

也正因为卡在这里，我们才换了个思路。

放弃执行层，先看审核段

聊到后面，我们的思路慢慢变了。既然执行层跑不顺，就没必要硬上。图片识别和自动填底稿，非标准化的内容太多，也对具体格式要求也很高。而且任何一个环节出了偏差，后面都会返工。与其盯着“让 AI 替人做完”，不如先看它能不能在审核环节帮上忙。这里不要求它直接填表，也不要求它计算结果。

而是先做底稿的检查，看是否满足具体的程序要求：底稿中是否有文件缺失。查漏，但不补缺。再比如查法规政策，检查各环节风险是否处理得当，这才更接近它目前真正擅长的部分。

后来再想，他这两周也不算白折腾。至少有一件事被试出来了：审计里最难交出去的，从来不是填表这个动作，而是看到一个数字以后，愿不愿意停下来，再核一遍。这一眼，现在还是得靠人。