type
Post
status
Published
date
Apr 1, 2026
slug
content-5f8e7a0a-8b0f-4a1e-bc6e-0f6f6c9c1f7a
summary
在这篇文章中,审计同事的“龙虾”项目遭遇了重大失败,原计划通过AI实现票据识别和财务明细自动填表,但实际上两项核心功能都无法正常运作。图片识别因材料复杂性导致识别率低下,而在填表过程中,非标准化的数据格式和缺乏判断能力使得自动化变得困难。最终,团队决定放弃执行层的尝试,转而利用AI进行审核,重点检查底稿是否满足程序要求。这一转变使得审计流程更为高效,同时也让团队意识到,核实数字的判断仍需依赖人类的经验与直觉。
tags
技术
工具
开发
category
技术分析
icon
password
是的,他养”龙虾“之前,心心念念的两个核心功能全翻车了。
前两天,我们聊起这件事。
两周前,他斥资巨款购入“小龙虾”,主要想让它帮自己做两件事:
1、识别票据图片中的内容;
2、把财务明细分类自动填到底稿。
但在实际项目里,两件事都没跑通。问题不在小龙虾好不好用,也不是选的AI模型够不够新,而在审计现场和自己定制功能测试的场景根本不是一回事。很多看着“差不多能用”的能力,真进项目就差一口气。可后来我发现,最麻烦的还不是第一步。

先卡住的是”图片识别“
他的第一个想法并不复杂:把客户发来的凭证、流水、发票图片交给小龙虾,再用文字一步步告诉它该用什么工具、什么技能,就像平时带实习生一样。先把照片发给指定工具做识别,再按约定格式输出,最后按正确格式填进对应表格。
但审计现场拿到的材料很少规整。可能是盖着公章、压住数字的银行流水,也可能是客户斜着拍的发票,或者手写和打印混在一起的老凭证。
材料一复杂,识别率就往下掉。财务数据特别细碎,模型的容错率很低。识别率只有八成,剩下那两成就得逐行复核。算下来,成本往往比手工录入还高。
更麻烦的是,AI会认字,却不一定懂财务逻辑。它可能把“价税合计”当成“本金”。没有专业校验规则托底,根本没法用。可真正让他停下来的,还在后面。

填表难的不是动作,是判断
图片识别没跑通,他又去试第二步:把提取出的数据自动匹配,再填进Excel底稿。
这一步看着像搬运,做起来却不是。先碰到的是“非标”。不同客户的发过来的科目体系不一样,不同行业的底稿格式不一样,同一家客户不同年度的表也可能改。测试的时候里勉强跑通的规则,一到真实场景或者换个客户就失效。
但更难的不是格式,而是判断。填底稿,并不是把数字填进行就可以了的。比如一笔5000元的“办公用品”报销,AI自然直接归进管理费用。可有要是人会翻下附件、看背景,再判断它到底该进哪一类。搞不好是招待费,或者是员工福利。
而且小龙虾有一个很要命的问题:它的执行路径是线性的。就算你让它重新检查,前面的错误依然会循环影响后面的结论。一步错,后续就会步步错。它不会自己停下来,也不会主动怀疑。
而人很多时候会不断自省,一旦发现错误就会及时纠正,不会一直错下去。
也正因为卡在这里,我们才换了个思路。

放弃执行层,先看审核段
聊到后面,我们的思路慢慢变了。既然执行层跑不顺,就没必要硬上。图片识别和自动填底稿,非标准化的内容太多,也对具体格式要求也很高。而且任何一个环节出了偏差,后面都会返工。
与其盯着“让 AI 替人做完”,不如先看它能不能在审核环节帮上忙。这里不要求它直接填表,也不要求它计算结果。
而是先做底稿的检查,看是否满足具体的程序要求:底稿中是否有文件缺失。查漏,但不补缺。再比如查法规政策,检查各环节风险是否处理得当,这才更接近它目前真正擅长的部分。
后来再想,他这两周也不算白折腾。至少有一件事被试出来了:审计里最难交出去的,从来不是填表这个动作,而是看到一个数字以后,愿不愿意停下来,再核一遍。
这一眼,现在还是得靠人。