百科狗-知识改变命运!
--

如何使用ABBYY FineReader PDF 15来制作双层PDF

是丫丫呀11个月前 (12-16)阅读数 7#综合百科
文章标签文本文档

PDF文档包含了图像型PDF(比如由扫描生成的文件,包含图像层)与文本型PDF(比如由word生成的文件)的文档类型,其区别在于是否可作文本的搜索。随着技术的发展以及人们需求的提升,很多人都需要从图像型PDF中获取文本信息,在这种情况下,双层PDF就应运而生了。

双层PDF实际上是在图像型PDF基础上,建立一个文本识别层,该文本层包含了可搜索的文本信息,我们可复制、搜索其中的文本。ABBYY FineReader PDF 15提供了制作双层PDF的功能,那么,该怎么使用呢?

一、使用OCR编辑器功能

如何使用ABBYY FineReader PDF 15来制作双层PDF

双层PDF的制作,实际上就是进行图像智能文本识别的过程。因此,我们需要使用到ABBYY FineReader PDF 15的OCR智能文本识别技术。

如图2所示,在ABBYY FineReader PDF 15的创建任务页面使用“在OCR编辑器中打开”的功能,即可使用其“PDF文档和图像的高级转换功能”。

二、识别图像中的文本

使用OCR编辑器打开目标图像型PDF文件后,ABBYY FineReader PDF 15会自动开启OCR文本识别,该过程会花费一些时间。

待软件完成图像的文本识别后,如图4所示,就可以在软件右侧的文本识别区域获取到识别后的文本。

我们需要检查一下文本是否有识别错误。一般情况下,ABBYY FineReader PDF 15能达到很高的文本识别准确度,只有个别特殊符号可能会无法识别,但为了确保文档的严谨性,我们最好还是检查一下。

三、另存为可搜索PDF文档

确认文本识别无误后,如图5所示,打开文件菜单中的另存为选项,并选择其中的另存为“可搜索PDF文档”,即可创建双层PDF文档。

完成双层PDF文档的制作,如图6所示,打开PDF文档,可以看到,文本已经变为可选的状态,我们可对这些文本进行复制、搜索等。

四、小结

ABBYY FineReader PDF 15的智能OCR文本识别功能,可快速地将图像型的PDF文档转换为带有文本层的可搜索PDF文档,实现文档的更有效利用,避免了人工抄写的繁琐,是一个很实用的功能。

一、主体不同

1、PDF文档:是由Adobe Systems用于与应用程序、操作系统、硬件无关的方式进行文件交换所发展出的文件格式。

2、PDF/A文档:作为电子档案保存的最佳解决方案在成为业界事实标准后,于2005年5月,又获国际标准化组织ISO批准,成为一项国际标准。

二、特点不同

1、PDF文档:为电子归档工作寻找一个能够长期、安全保存文件内容的方式,将来检索时,能够保证文件拥有始终如一的显示效果。

2、PDF/A文档:是支持跨平台上的,多媒体集成的信息出版和发布,尤其是提供对网络信息发布的支持。

三、优势不同

1、PDF文档:可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中。

2、PDF/A文档:是PDF格式的子集。包括能够可靠地进行印前打印、高端彩色广告传送的PDF/X标准。

百度百科-pdf

百度百科-PDF/A

鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com

免责声明:我们致力于保护作者版权,注重分享,当前被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!邮箱:344225443@qq.com)

图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,本着为中国教育事业出一份力,发布内容不收取任何费用也不接任何广告!)