千锋教育-做有情怀、有良心、有品质的职业教育机构

400-811-9990
手机站
千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站

领取全套视频
千锋教育

关注千锋学习站小程序
随时随地免费学习课程

上海
  • 北京
  • 郑州
  • 武汉
  • 成都
  • 西安
  • 沈阳
  • 广州
  • 南京
  • 深圳
  • 大连
  • 青岛
  • 杭州
  • 重庆
当前位置:杭州千锋IT培训  >  技术干货  >  OCR (光学字符识别)如何工作?

OCR (光学字符识别)如何工作?

来源:千锋教育
发布人:xqq
时间: 2023-10-15 01:11:58

一、OCR 如何工作?

OCR 引擎或 OCR 软件通过以下步骤工作:

1、图像采集

扫描仪读取文档并将这些文档转换为二进制数据。OCR 软件分析扫描的图像,将淡色区域分类为背景,将深色区域分类为文本。

2、预处理

OCR 软件首先清理图像并删除错误,以为读取做好准备。以下为其使用的一些清理技术:

扫描期间,对扫描文档进行轻微的偏移校正或倾斜,以修复对齐问题。去除杂点、移除数字图像斑点或平滑文本图像边缘。清理图像中的边框和线条。多语言 OCR 技术的脚本识别

3、文本识别

OCR 软件用于文本识别的 OCR 算法或软件流程的两个主要类型为模式匹配和特征提取。

模式匹配

模式匹配分离字符图像(称为标志符号),并将其与存储的类似标志符号进行对比。模式匹配仅在存储的标志符号与输入的标志符号具有类似字体和大小时才能发挥作用。对于以已知字体输入的文档的扫描图像,此方法效果很好。

特征提取

特征提取将标志符号分割或分解为线条、闭环、线条方向和线条焦点等特征。然后,其使用这些特征在存储的多种标志符号中查找最佳匹配或最相近的匹配。

4、后处理

分析后,系统将提取的文本数据转换为计算机化的文件。某些 OCR 系统可以创建带注释的 PDF 文件,内含扫描文档的扫描前后版本。

声明:本站稿件版权均属千锋教育所有,未经许可不得擅自转载。

猜你喜欢LIKE

什么是云存储?

2023-10-15

什么是托管安全服务 (MSS)?

2023-10-15

什么时候需要进行数据的标准化?

2023-10-15

最新文章NEW

计算机网络的拓扑结构有哪些?

2023-10-15

路径搜索算法有哪些?

2023-10-15

什么是低代码?

2023-10-15

相关推荐HOT

更多>>

快速通道 更多>>

最新开班信息 更多>>

网友热搜 更多>>