目录

摘要提取器&IPO披露文件下载器-v0.8.4

同事需要从序时账摘要信息中提取出公司名称。

如:

支付xxx公司2025年1月xxx费用

由于这个也没有什么规律,曾经我记得也有项目组提过这个需求,但没法准确的做。

但有了 AI 现在就可以做了。

给 AI 描述了下需求,帮我写了功能。

Excel 文本信息提取

AI API 设置

你可以注册一个 AI 平台的账号,将其 base_url 和 API_key 参数填写到审计工具箱的“参数设置”界面并保存。

可以参考文章:《合同、权证、纳税申报表批量识别!审计工具箱v0.6.8更新》

当然,你有私有化部署 AI 的能力,也可以填写你本地或服务器部署的API 。( 兼容 openai 格式 )

运行功能

打开审计工具箱,双击“Excel 文本信息提取”:

点击“填写数据”,自动打开配置表:

配置表填写

  • 语言模型名称:填写AI平台支持的模型名称。

  • 系统提示词:不用动。

  • 用户提示词:根据你需要提取的内容更改提示词。

  • 处理文件夹:将你要处理的文件放在文件夹下,复制该文件夹的路径。

  • 待处理列名:填写Excel中需要处理的列名。

  • 关键词筛选:如果仅对包含某关键词的信息进行提取,就填写关键词,多个关键词用;分隔。

  • 批处理大小:每次处理行数,越大越节约token,但可能准确度会降低。默认设置为10,可以改大小,自己测试。

    填写完成后,保存配置表。

    点击“开始运行”,会执行自动提取,提取的信息会在表后添加列。

    执行完成后,可以点击“查看结果”在 output 文件夹下查看生成的文件。

    考虑到序时账数据量比较大,因此设计时每次请求都会追加写入数据,因此即使中断了,已请求的会保存。

    同时,支持断点续处理。第一次中断了,如果没有删除output中的文件,再次运行会接着之前的继续进行处理。

IPO 披露文件批量下载

新增了交易所 IPO 披露文件批量下载功能。

同样双击对应功能,点击“填写数据”打开配置表。

下面以北交所为例:

填写好你想下载的时间区间。

更新模式选择“文件”,则只下载在该时间区间的文件。

如果选择“项目”,则以该项目最新更新文件为判断条件,会下载整个项目的文件。

填写好配置文件后,保存。再点击“开始运行”。

程序就会自动下载文件:

点击“查看结果”,可以看到按行业分类了下载的IPO披露文件。

另外上交所与深交所文件下载方式相同。

其它更新

明细表功能变动:

  1. 生成模式变成以工作簿为中心,避免相同底稿模板生成时多次打开关闭。(以前多个科目写入相同工作簿会多次打开关闭),提升了执行效率。
  2. 以多年数据源生成账龄时,取消配置表中"往来唯一性"填写。统一在底稿中插入批注以“字段名#",批注末尾为#号的为聚合字段。( 注:对于以多年数据生成往来时,需要在底稿模板中对客商批注末尾加#)

下载方式

百度网盘

https://pan.baidu.com/s/1lTFQUkzT9Lw4DMMYBb6UHg?pwd=nigo

夸克网盘

https://pan.quark.cn/s/42ea2fa12381

123网盘

https://www.123865.com/s/erGFjv-yWJ6d?pwd=nigo

UC网盘

https://drive.uc.cn/s/3bf46ee723594?public=1

或者在【审计军火库网盘】中下载,路径为:

【审计军火库-02-工具模板区-审计效率工具-逆行的狗-审计工具箱】

如果测试有问题,可以在免费的【审计军火库】知识星球中反馈。