网站服务热线:
当前位置:
首页 > 资讯 > 技术应用 > 正文

印刷构架内组配构件的智能抬升运算

来源:中国喷码机网发布日期:2013-06-29

  在上述两个特征中,特征1)可用于将表格区域从版面图像中提取出来,有时一幅尺寸较大的图形也会具有特征1),为避免将其误认为表格而提取出来,有必要进一步甄别所提取的图像是否具有特征2)。在经过2级筛选后,即可基本确定所提取的图像为表格图像。

  基于变尺度连通特征的表格文本提取方法所谓变尺度连通特征,是指表格与表格中文字,均具有连通特性,但它们之间存在着明显的尺寸差异。因此,本方法的基本思想是,通过改变连通区域提取的尺度,首先在大尺度下将表格从整个版面图像中提取出来,再在小尺度下将文字从表格中提取出来。具体步骤如下:1)提取大尺度连通区域。利用连通区域搜索算法,在大尺度条件下,搜索版面上的连通区域,得到区域位置坐标。

  2)核实表格区域。利用上节表格特征2),对所得到的区域图像进行检验,根据该区域有无表格特征,来判定其是否确实为表格区域。3)提取小尺度连通区域。针对所得到的表格区域,再做一次小尺度的连通区域搜索,找出其中的小连通区域(尺寸为文字尺寸量级,该参数可由版面连通区域的统计直方图获得)。4)得到表格文字。对上一步得到的连通区域按距离特征进行处理,使多连通区文字得到合并(如/品0字,是由3个连通区域组成),成为完整的文字区域。

  本算法的*终结果就是表格中文字区域的位置坐标。将此信息传送给文字识别系统,即可根据这些位置信息,自动获得文字图像进行识别。

  连通区域搜索算法本连通区域搜索算法只需要对图像进行一次扫描,就可以将图像中所有连通区域坐标信息记录下来,供分析、处理使用。其核心思想是开辟了一块称为/中介缓冲区0的、能够存储一行图像数据的内存单元。利用此缓冲区来记忆当前扫描行以前各行的行程邻近情况。在扫描开始之前,将/中介缓冲区0清0,在每一次扫描当前行之前,将/中介缓冲区0中不为0的点置1,将当前行不为0的点置为2,这样,在将当前行与/中介缓冲区0进行/或0运算后,/中介缓冲区0各点的值就反映出了当前行及其以前行之间的行程邻近情况,进而就可以判断出连通区域的开始与结束,并记录连通区域的位置坐标。本算法对文字识别所使用的300dpi版面图像按150dpi的分辨率进行处理,即横向和纵向各每隔一点取一点,这样做既能提高搜索速度,又可满足精度要求。尺度选取可以通过限制连续点区域长度来进行。搜索结果、。表格连通区域就是它自身的外围框线,而文字连通区域可以是文字整体的外接框;也可以是组成文字的部件的外接框(此时一个文字由多个连通区域组成)。

  表格特征的检验在利用连通区域搜索算法提取的符合表格尺寸特征的连通区域中,尚不能排除包括图形、图像等成分构成的连通区域的可能性(因为它们的尺寸也比较大)。此时,要利用表格内含贯穿整个区域的横、竖线的特征。为了提取表格内线特征,定义了行程转化位置函数Xm、Yn,分别记录X方向和Y方向的行程转化情况及其相应的坐标值。

  Xm:第m行第i次行程转化的X坐标;Yn:第n列第j次行程转化的Y坐标。其中,m、n应分别小于图像的高度和宽度。假设待判定连通区域坐标为(X1,Y1)、(X2,Y2),则当存在满足条件(|X1-Xy1||||  文字区域的获得针对上一阶段所得到的表格区域,利用2.2得到的文字尺度,再做一次小尺度的连通区域搜索,找出其中的小连通区域。这些小尺寸的连通区域均为文字或文字部件所形成的连通区域。

  得到表格文字得到的连通区域有可能是汉字部件连通区域,而不是完整的汉字连通区域,如中/北0、/旦0、/品0等字所示。属于同一个汉字的不同部件的连通区域之间的距离极小,可按距离特征进行合并,这样,就得到了表格中诸文字的位置坐标。

  结论在Windows环境下,利用VisualC++开发了采用本文所述方法的表格文字提取程序。实测样张取得了较好的效果。另外,发现图像歪斜虽然对连通区域搜索算法影响不大,但可能降低利用行程转化位置函数判定表格区域的准确性。故在提取表格区域前,加入了图像倾斜自动校正模块,方法请见参考文献<2>,不再赘述。

  

(完)

更多资讯!欢迎扫描下方二维码关注喷码机产业网官方微博。

喷码机产业网