卧草泥马 发表于 2023-7-18 14:41:28

怎么识别提取PDF里面的文字和图片-更新需求

本帖最后由 卧草泥马 于 2023-7-19 10:43 编辑

几十年的老公司,很多文档全是纸质的,现在需求是要扫描成PDF,然后再把里面文字和图片提取出来。

1、公司是内网,与互联网不连。
2、文档扫描后整份上传,所以手工操作adobe软件这些方案也通不过。

有哪个大佬知道怎么解决吗?

weoer 发表于 2023-7-19 12:01:10

用不需要联网的OCR软件就可以了,做多自己把库下载下来。

eltonto 发表于 2023-7-18 15:28:42

ocr技术

免费的有天若ocr

yyze77 发表于 2023-7-18 15:55:35

目前在用破解版 福昕

mtgfgb 发表于 2023-7-18 21:46:25

:):):):):):):):):):):)

卧草泥马 发表于 2023-7-19 08:37:07

eltonto 发表于 2023-7-18 15:28
ocr技术

免费的有天若ocr

这个可能不行,公司内网,接不到外网

忆又未尽 发表于 2023-7-19 10:19:18

Acrobat DC

阿阿勇 发表于 2023-7-19 11:18:49

华为相册有提取图片文字功能,微信里长按图片也有提取文字功能
WPS的PDF里有提取文字功能,当需要连网

eltonto 发表于 2023-7-19 11:55:42

abbyy ocr,这个是不联网的

741111 发表于 2023-7-19 14:38:22

本帖最后由 741111 于 2023-7-19 14:44 编辑

同问,pdf扫描件里的表格,如何提取表格内容?
页: [1] 2
查看完整版本: 怎么识别提取PDF里面的文字和图片-更新需求