关于对数学公式识别的分析及探讨

　　数学公式低级。低级识别就是要切割并识别出数学公式中的所有符号。一般的商业（系统能很好地利用启发式信息处理线性排列的文本，而数学公式通常不是线性排列的，且字符大小经常变化，字符的出现频率也不同于普通文本，因此许多偏向普通文本的启发式方法用于数学表达式时往往会得到适得其反的效果，使一般OCR系统对含有数学表达式的文档显得无能为力，识别率往往降到10%甚至更低。但有利的是，数学公式中一般只使用很少几种字体及其风格。因此有必要开发专门的识别引擎识别数学公式中的符号，识别引擎不但应该给出字符识别结果，还应该给出字符的外接矩形，字体信息，甚至字符的字号。这些信息将为后面的高级识别带来许多方便。如果某个字符被拒识，就考虑其是粘连字符。将该字符的所有曲线段根据中点，按照从左到右，从下到上的顺序排序。每条曲线段用三个特征值表示。使用动态规划的方法，比较标准字符的曲线段特征值与拒识字符的前若干个曲线段的特征值，得到*近似的结果。就认为这前若干个曲线段构成该字符，删除这些曲线，重复上面的方法，就实现了粘连字符的切割。

　　数学公式高级识别结果输出高级识别后，我们就可以将分析结果按照要求保存为相应格式。数学知识作为人类的巨大财富，广泛应用于各个领域，无数数学公式存在于各种文献之中。如果能够构造出实用的自动数学公式识别系统，将这些纸质的文献转变为可复用的电子文献，对科技的加速发展也是有很大意义的。但是数学公式处理是一个具有相当难度和研究性的前沿课题，目前的研究只是对规则的简单公式取得了较好的处理结果，而对一般包含公式的文献，无论是公式定位，低级识别还是高级识别，都还没有取得非常令人满意的结果。此外，因为数学公式的二维特点，到目前为止，没有任何文献提出评价数学公式高级识别结果水平的指标，分析结果的好坏只能由人工评判。因此前人的研究成果几乎都只是在几十甚至十几个公式集上取得的，这就严重阻碍了数学公式处理研究的进一步发展。

(完)

关于对数学公式识别的分析及探讨

相关文章