本软件主要功能是版面对象(文字、表格、公式、图形等)的自动识别,包括版面分割、样式识别、表格识别、公式识别、图形解析、文字识别与元数据抽取等。可用于数字内容制作(如点读书热区检测)、文件格式转换(如PDF到EPub)、表单识别与金融文档处理、数学公式识别与结构化拷贝、题库构建与试题检索、漫画制作与检索等。目前支持图像、PS、PDF、Word、EPub、网页等文件格式,支持图书、论文、证券研究报告、试题、表单类数据等。
本产品可应用于数字出版、金融科技、电子书、题库、在线教育、咨询、动漫等领域的内容加工与信息挖掘。
有关方法和软件已经开发近15年,不断进行更新,并已在多个行业与公司实际应用。
扫码关注,查看更多科技成果