目录

资料文件AI自动整理工具-v0.7.8

对于一个大型项目,你收到了大量资料文件,以前你需要安排人工去归集整理。

比如,你想批量将每家公司的资料按指定的目录结构进行整理。

那么今天介绍的功能,应该能帮助到你。

下面简要介绍操作方法:

AI API 设置

你可以注册一个 AI 平台的账号,将其 base_url 和 API_key 参数填写到审计工具箱的“参数设置”界面并保存。

可以参考文章:《合同、权证、纳税申报表批量识别!审计工具箱v0.6.8更新》

当然,你有私有化部署 AI 的能力,也可以填写你本地或服务器部署的API 。( 兼容 openai 格式 )

使用“文件自动分类”功能

双击“文件自动分类”,进入该功能:

点击“填写数据”,会打开配置表。

配置表填写

基础配置表填写

  • 视觉模型名称:视觉模型名称,用于处理pdf和图片。
  • 语言模型名称:大语言模型名称,用于处理文本。
  • 输出文件模式:如果填写“文件”则输出目录下只包含分类类别文件夹,如果填写“文件夹”会附带文件原始末级文件夹目录到分类文件夹中。
  • 公司模式:如果填写“单一”,则处理文件夹作为一家公司进行处理,如果填写“多个”,则处理文件夹的下级文件夹每个作为一家公司分别进行处理,相当于把一级目录层级带过去了。
  • 处理文件夹:填写待整理的文件夹路径。
  • 输出文件夹:填写输出文件夹路径(会将“处理文件夹”路径下的文件复制过来)。

类型配置表填写

A 列填写你想要整理成的文件类别,会按这个名称创建子文件夹。

如果通过这个名称能够容易识别出类型,那么就不需要写描述信息。否则你可以通过补充描述信息,让AI能更准确理解这个类型。

另外支持输出文件夹下多层级目录输出。

比如:文件类别中填写“其它资料/不动产抵押权证”

在识别时,它是按“不动产抵押权证”作为类别识别,

但是输出目录时会创建二级目录“其它资料->不动产抵押权证”两级目录层级。

因此,你可以设计出多级层目录。

运行程序

填写好配置表并保存后,点击“开始运行”,程序会自动利用 AI 将原始文件复制整理到新的文件夹下:

对于判断不了的或者识别度不高的会放在“未分类”文件夹下,可以再由人工进行处理。

工具下载

链接:https://drive.uc.cn/s/c7c4124b24cb4?public=1

或者在【审计军火库网盘】中下载,路径为:

【审计军火库-02-工具模板区-审计效率工具-逆行的狗-审计工具箱】

如果测试有问题,可以在免费的【审计军火库】知识星球中反馈。

( 注:链接有效期 180 天,请在知识星球中获取最新下载链接 )