本发明公开了一种结合字符级和字符串级分类的文本检测和识
别方法,在图像中提取可能属于同一字符的像素集形成备选字符;滤
除不满足字符几何特征统计规律的备选字符;采用基于字符旋转和尺
度不变性特征的字符级分类器对备选字符分类,以确定备选字符为某
字符的概率;将字符两两合并形成初始字符串;计算两两字符串间的
相似度,将相似度最高的两字符串合并成新的字符串,直到没有可再
合并的字符串;采用基于字符串结构特征的字符串级分类器对字符串
分类,以确认具有语意的字符串;利用待识别字符为某一字符的概率
对字符串识别,得到语意文本。本发明将文本检测和识别过程作为一
个整体,利用检测和识别的相互作用提高结果精度,简单高效。
扫码关注,查看更多科技成果