本发明公开了一种阿拉伯语光学字母识别方法,包括以下步骤:
接收包含阿拉伯语文本的输入图像,通过检测所述输入图像中每个读
音符号的边界框、并将其坐标与文本主体的边界框坐标比较去除所有
读音符号,将每个输入图像划分为四层,并对所述四层执行特征提取,
将特征提取的结果输入隐马尔可夫模型,以生成表示每个阿拉伯语字
母的隐马尔可夫模型,对生成的表示每个阿拉伯语字母的隐马尔可夫
模型进行迭代训练,直至满足似然比准则为止,将迭代训练后的隐马
尔可夫模型输入决策树,以预测读音符号的位置和类别,并生成最终
识别结果。本发明能够利用阿拉伯语的书写特性使识别任务更简单,
并具有较高的识别精度。
扫码关注,查看更多科技成果