基于 HMM 和决策树的阿拉伯语光学字母识别方法
本发明公开了一种阿拉伯语光学字母识别方法,包括以下步骤: 接收包含阿拉伯语文本的输入图像,通过检测所述输入图像中每个读 音符号的边界框、并将其坐标与文本主体的边界框坐标比较去除所有 读音符号,将每个输入图像划分为四层,并对所述四层执行特征提取, 将特征提取的结果输入隐马尔可夫模型,以生成表示每个阿拉伯语字 母的隐马尔可夫模型,对生成的表示每个阿拉伯语字母的隐马尔可夫 模型进行迭代训练,直至满足似然比准则为止,将迭代训练后的隐马 尔可夫模型输入决策树,以预测读音符号的位置和类别,并生成最终 识别结果。本发明能够利用阿拉伯语的书写特性使识别任务更简单, 并具有较高的识别精度。
华中科技大学
2021-04-11