怎么识别提取PDF里面的文字和图片-更新需求
本帖最后由 卧草泥马 于 2023-7-19 10:43 编辑几十年的老公司,很多文档全是纸质的,现在需求是要扫描成PDF,然后再把里面文字和图片提取出来。
1、公司是内网,与互联网不连。
2、文档扫描后整份上传,所以手工操作adobe软件这些方案也通不过。
有哪个大佬知道怎么解决吗? 用不需要联网的OCR软件就可以了,做多自己把库下载下来。 ocr技术
免费的有天若ocr 目前在用破解版 福昕 :):):):):):):):):):):) eltonto 发表于 2023-7-18 15:28
ocr技术
免费的有天若ocr
这个可能不行,公司内网,接不到外网 Acrobat DC 华为相册有提取图片文字功能,微信里长按图片也有提取文字功能
WPS的PDF里有提取文字功能,当需要连网 abbyy ocr,这个是不联网的 本帖最后由 741111 于 2023-7-19 14:44 编辑
同问,pdf扫描件里的表格,如何提取表格内容?
页:
[1]
2