1.2.3 现有方法总结
我们通过文献调研发现,现有文献中针对笔迹生物特征识别方法的研究相对比较少。这主要是因为笔迹识别是一个相对更加困难的模式识别问题。第一,个人笔迹作为一种行为特征,受多方面因素的影响。同一书写者的笔迹本身的变化就很大。另外,书写者风格是通过笔迹文本体现的。不同的文本包含不同的字符集合,不同字符有不同的笔画结构,笔迹风格差异是附加在巨大的内容差异之上的。再加上书写者实际所能提供的笔迹样本一般较少,笔迹识别几乎囊括了模式识别的几大难点问题:类内变化大、大类别和小样本。下面分几个方面对脱机笔迹识别主要方法进行简要总结。
(1)笔迹风格在笔迹文本中,既体现在整篇笔迹的全局属性上,也体现在局部某个单词、某个字符甚至某一笔画上。基于全局属性的笔迹识别一般采用文本无关的方法,从篇章笔迹的整体图像上提取相对一致的布局、纹理等统计特征。从局部属性入手的笔迹识别,往往把单词、字符作为处理对象,采用文本相关的方法,在相同单词或字符上提取最能反映风格差异的特征。
(2)由于以拼音文字为主的西方文种笔迹和以方块文字为主的东方文种笔迹在字符结构和书写方法上的不同,当相同的笔迹识别方法分别运用于东西方文字时会存在性能差异。西方文字字母类别较少、笔画结构简单,文本相关方法很难依靠少数几个字母获得较高的识别性能。相同字符数条件下,文本相关方法在东方文字笔迹上能得到更准确的鉴别结果。另外,虽然在一般意义上,文本无关方法可以应用于不同文种的笔迹,但基于纹理分析的方法在汉字笔迹上的实际性能却并不理想。这是因为巨大的汉字字符类别数和复杂的汉字字符结构增大了笔迹文本内容的变化空间,从中提取微小的文本无关笔迹特征更加困难。而少数简单字母在文本中的高重现率,却使得西方笔迹文本的布局和纹理相对有序,更利于提取文本无关的版面特征。因此,东方文字笔迹识别研究中,采用文本相关方法较多,而文本无关方法在西方文字笔迹识别中应用的更多。
……
展开