手写体汉字的典型分类方法有:(1)方向复合类似度法。针对手写体汉字笔划位置变化大的特点,我们提出了赋予图象点方向特征,按方向进行发胖,求方向复合类似度的方法。(2)用方向密度矢量对手写印刷体汉字进行大分类。
此方法按以下步骤进行:a、细线化;卜赋予方向;c、区域设定;d、方向密度矢量的抽出;e、分类。识别时计算待识别文字的方向密度矢量与字典文字的方向密度矢量之间的距离,按从小到大的顺序排序,取前面n位作为候补文字。汉字偏旁部首的抽出及分阶段的识别方法,汉字中很多字具有共同的部分?部首,因此,可以先识别出一组汉字的共同部分,再识别剩余部分,这样识别的难度将大大下降,并能提高识别速度,先识别偏旁,再识别剩余部分正是基于这一思想提出来的分阶段识别方法.
手写印刷体汉字的识别方法手写印刷体汉字的识别在分类的基础上进行,两者是紧密联系在一起的。
典型的识别方法主要有:(1)松弛匹配法。这是识别汉字的一个好方法,它较好地解决了笔划变形的影响,相对位置关系代替绝对位置的关系,特别在对应线段的选择上,它不是孤立地只考虑线段本身特征,而是强调其周围的近傍线段是否适配,而近傍线段选择对应时,又有是否适合其周围的近傍线的问题,这样一环套一环的相互影响,就能达到全局的*佳匹配效果。松弛匹配法的主要缺点是计算量大,识别速度偏低,对近似字的区分能力也不足。
(2)动态有序弹性匹配方法。该方法吸收了松弛匹配法的优点,克服了其速度慢的缺点,解决了在手写体汉字外轮廓线匹配中的对应选择问题,使匹配速度大约比松弛匹配提高了一个数量级。其基本思想是按照规定的顺序进行输入字与字典特征的对应选择,在进行线段的对应选择时,通过线段的前后适合方式将平面关系变为顺序关系,除了线段本身的位置、长短、方向在容许的变化范围内进行对应外,还需要前后线段适合,不允许出现前后顺序颠倒的对应选择。
当选择出现两条以上候补的竟争时,按前后的适合关系及在一定的局部范围内达到*大匹配为准则,几因而对应选择是动态进行的,它不需要象松弛匹配那样进行多次迭代才能达到线段间的对应,而是在外围轮廓线对应选择确定的基础上,再进行内层线段的对应选择。
(3)抽取笔道结构,识别手写印刷体汉字。其它相关技术在手写体汉字识别中,为了解决近似字混淆的问题,需要在大量识别的基础上,统计出哪些字之间字形相近,生成字形相近字表,并为这些字制定一个判别参考表,它包括:(l)特征区域指定;(2)搜索特征的指定;(3)指定应该调用的子程序,返回特征及字符判定表等。
(完)