摘要提取器&IPO披露文件下载器-v0.8.4
同事需要从序时账摘要信息中提取出公司名称。
如:
支付xxx公司2025年1月xxx费用
由于这个也没有什么规律,曾经我记得也有项目组提过这个需求,但没法准确的做。
但有了 AI 现在就可以做了。
给 AI 描述了下需求,帮我写了功能。
Excel 文本信息提取
AI API 设置
你可以注册一个 AI 平台的账号,将其 base_url 和 API_key 参数填写到审计工具箱的“参数设置”界面并保存。
可以参考文章:《合同、权证、纳税申报表批量识别!审计工具箱v0.6.8更新》
当然,你有私有化部署 AI 的能力,也可以填写你本地或服务器部署的API 。( 兼容 openai 格式 )
运行功能
打开审计工具箱,双击“Excel 文本信息提取”:
点击“填写数据”,自动打开配置表:
配置表填写
-
语言模型名称:填写AI平台支持的模型名称。
-
系统提示词:不用动。
-
用户提示词:根据你需要提取的内容更改提示词。
-
处理文件夹:将你要处理的文件放在文件夹下,复制该文件夹的路径。
-
待处理列名:填写Excel中需要处理的列名。
-
关键词筛选:如果仅对包含某关键词的信息进行提取,就填写关键词,多个关键词用;分隔。
-
批处理大小:每次处理行数,越大越节约token,但可能准确度会降低。默认设置为10,可以改大小,自己测试。
填写完成后,保存配置表。
点击“开始运行”,会执行自动提取,提取的信息会在表后添加列。
执行完成后,可以点击“查看结果”在 output 文件夹下查看生成的文件。
考虑到序时账数据量比较大,因此设计时每次请求都会追加写入数据,因此即使中断了,已请求的会保存。
同时,支持断点续处理。第一次中断了,如果没有删除output中的文件,再次运行会接着之前的继续进行处理。
IPO 披露文件批量下载
新增了交易所 IPO 披露文件批量下载功能。
同样双击对应功能,点击“填写数据”打开配置表。
下面以北交所为例:
填写好你想下载的时间区间。
更新模式选择“文件”,则只下载在该时间区间的文件。
如果选择“项目”,则以该项目最新更新文件为判断条件,会下载整个项目的文件。
填写好配置文件后,保存。再点击“开始运行”。
程序就会自动下载文件:
点击“查看结果”,可以看到按行业分类了下载的IPO披露文件。
另外上交所与深交所文件下载方式相同。
其它更新
明细表功能变动:
- 生成模式变成以工作簿为中心,避免相同底稿模板生成时多次打开关闭。(以前多个科目写入相同工作簿会多次打开关闭),提升了执行效率。
- 以多年数据源生成账龄时,取消配置表中"往来唯一性"填写。统一在底稿中插入批注以“字段名#",批注末尾为#号的为聚合字段。( 注:对于以多年数据生成往来时,需要在底稿模板中对客商批注末尾加#)
下载方式
百度网盘
https://pan.baidu.com/s/1lTFQUkzT9Lw4DMMYBb6UHg?pwd=nigo
夸克网盘
https://pan.quark.cn/s/42ea2fa12381
123网盘
https://www.123865.com/s/erGFjv-yWJ6d?pwd=nigo
UC网盘
https://drive.uc.cn/s/3bf46ee723594?public=1
或者在【审计军火库网盘】中下载,路径为:
【审计军火库-02-工具模板区-审计效率工具-逆行的狗-审计工具箱】
如果测试有问题,可以在免费的【审计军火库】知识星球中反馈。