丁香实验_LOGO
登录
提问
我要登录
|免费注册
点赞
收藏
wx-share
分享

Summer 大讲堂第 2 期:如何高效的从图中提取文字?

生物学霸

898
某天,Boss 说:某某,把这份文件打成 Word。然后,有的同学可能会拿起纸质稿打开 Word 开始「啪啪」打字......

那么,是否有更快捷的方法呢?答案是有的。这时候,我们需要利用 OCR(光学字符识别),具体的方法有很多,此处介绍三种。

假设我们需要将以下图片转成文字:

然后,我们逐一介绍这三种方法:

1、Office 工具

对于安装了 Office 2003 的同学们,可以使用其中的 Microsoft Office Document Imaging 功能。

第一步,我们使用 Microsoft Office Picture Manager 打开图片:

第二步,文件→打印→选择虚拟打印机 Microsoft Office Document Image Writer,如下:

然后,点击下一步→下一步→保存→完成,系统会自动调用 Microsoft Office Document Imaging,如下:

接着,我们选择「工具」→「使用 OCR 识别文本」,完成后,选择下方的「将文本发送到 Word」,系统会自动调用 Word,就可以获得图像中的文字了:

内容稍作修改即可。

而在 Office 2010 中呢,木有 Microsoft Office Document Imaging 功能,我们需要借助于 OneNote 图片,将图片插入 OneNote,如下:

然后选中图片,右键→复制图片中的文本:

OK,就这么简单,软件已经完成了识别工作,我们新建 Word,粘贴即可:

此外,值得一提的是,不知大家有没有注意刚才 OneNote 中右键菜单的最后一项「使图像中的文本可搜索」,我们选中它,会发现在右上角搜索栏键入一个搜索词后,图片中的文字变成可搜索的了:

OK,Office 就讲这么多,下面介绍使用 Adobe Acrobat X 进行 OCR 。

2、Acrobat 工具

开始前,确保安装了 Acrobat。如果原文件是 PDF,那么我们可以直接打开 PDF;如果是图片,我们首先需要将图片转换成 PDF,方法很简单,选中图片→右键→转换为 Adobe PDF:

Acrobat 会自动打开生成的 PDF 文件,如下:

我们点击右侧「工具」→识别文本→在本文件中,会发现图片已经转换为文本,可进行复制了:

直接复制到 Word 即可。

3、ABBYY FineReader 工具

FineReader 图片是一个专业的 OCR 软件,此处特别推荐第 11 版,Look:

它功能强劲,还可以选择文档语言,并进行组合,有兴趣的话大家可以自己去摸索,此处只做简要演示。

我们选择第二个选项「文件(PDF/图像)至 Microsoft Word,打开图片,软件即可自动完成识别:

最后软件会把结果发送至 Word:

OK,将图片转化成文字就先简单介绍到这,我们下周见。

文章编辑:大师兄

图片来源:Summer

提问
扫一扫
丁香实验小程序二维码
实验小助手
丁香实验公众号二维码
扫码领资料
反馈
TOP
打开小程序