一种快速准确的视频字幕提取方法
首先,抽取视频中关键帧的亮度图像; 接着,对当前关键帧的亮度图像来定位字幕条位置:首先采样关键帧的亮度图像,生成纹理图;接着确定水平字幕条的位置:先进行垂直纹理图水平投影求差分,然后确定水平字幕条上下边框,再确定水平字幕条左右边框;接着确定垂直字幕条的位置:先进行水平纹理图垂直投影求差分,然后确定垂直字幕条左右边框,再确定垂直字幕条上下边框;最后进行字幕条去噪,确定字幕条位置; 然后,确定字幕条起始帧和终止帧:首先,判断当前关键帧是否有字幕:如果没有字幕,则继续进行下→个关键帧的字幕条定位,直到有字幕条出现;如果出现字幕条,设当前关键帧为字幕条关键帧,则在前一个关键帧和字幕条关键帧之间确定字幕条的起始帧,然后用字幕条关键帧的字幕条区域依次匹配后面的关键帧,如果匹配一致,将继续匹配,直到匹配不一致,则在前一个关键帧和当前关键帧确定字幕条的终止帧: 最后,利用纹理去噪方法提取视频中的文字信息:首先,求存在同一条字幕的多帧视频帧亮度图像的字幕条区域的平均和图像:接着,将平均和图像进行OTSU分割,生成只有黑白两种颜色连通域的字幕区域图像;然后,对OTSU分割后的图像确定哪种颜色为文字区域:最后,剔除非文字噪声。
西安交通大学
2021-04-11