一种结合字符级分类和字符串级分类的文本检测和识别方法
本发明公开了一种结合字符级和字符串级分类的文本检测和识 别方法,在图像中提取可能属于同一字符的像素集形成备选字符;滤 除不满足字符几何特征统计规律的备选字符;采用基于字符旋转和尺 度不变性特征的字符级分类器对备选字符分类,以确定备选字符为某 字符的概率;将字符两两合并形成初始字符串;计算两两字符串间的 相似度,将相似度最高的两字符串合并成新的字符串,直到没有可再 合并的字符串;采用基于字符串结构特征的字符串级分类器对字符串 分类,以确认具有语意的字符串;利用待识别字符为某一字符的概率 对字符串识别,得到语意文本。本发明将文本检测和识别过程作为一 个整体,利用检测和识别的相互作用提高结果精度,简单高效。
华中科技大学
2021-04-11