目前基于AI的图像分析技术已经日趋完善,在人脸识别、车牌识别等场景的应用越来越广泛,市场竞争也愈发激烈。本成果面向更复杂的场景:视频分析。通过深度网络学习视频数据的时空特性,能够捕捉视频的动态信息并进行自动分析,达到不同应用的目标。目前在较难的视频分析任务—手语翻译上达到较为先进的水平。
通过该研究对基于AI的视频时空特征有了较为深入的了解。可以应用在视频监控中的行为识别(比如监控老人是否跌倒、部分场所可疑行为等)、动作识别(比如体育项目动作分析、体育运动自动教学等),医学视频数据分析(比如基于视频的疾病预测)、动物行为分析(比如基于视频的动物行为自动监测和分析)等任何需要借助视频来分析目标动态特性的场景。该技术需要针对不同的应用场景进行深入定制优化,甚至需要重新设计算法。
小试
扫码关注,查看更多科技成果