人工智能NLP 引擎_西安电子科技大学

主要研究自然语言处理研究领域的算法和应用实践。涉及语义解析、意图识别、FAQ 问答、多轮对话、知识图谱等关键技术，研究内容包括分词、向量表示、分类等文本预处理技术，以及将自然语言处理核心算法应用落实到智能客服、NLP 引擎、航天空管交互等实际场景中，团队研发的 AI 产品已经跟国内企业、研究所开展了长期合作并动态跟踪，获得了广泛的一致好评。

人工智能 NLP 引擎项目是基于多语种分词、多语种情绪识别、词句关系分析、意图识别、文本聚类等自然语言处理技术实现对海量录音文本的知识挖掘，识别重要信息。为录音服务行业下游业务的分析人员提供分析思路，以便得到多维度、多形式分析结果，将发现转换为可落地的业务决策，这些数据驱动的业务决策，包括客户体验、座席行为、产品改进、风险监测等多个方面，帮助企业改善用户体验、降低成本、提升效率、提升业绩、降低风险等。

1.多语种分词。分词指的是将一个字序列切分成一个一个单独的词，是将连续的字序列按照一定的规范重新组合成词序列的过程。文本在入库时调用接口进行了分词，分词可用于模型的匹配和热词的统计。

2.词句关系分析。根据词句关系接口识别的中心词，然后用中心词进行词频的统计，对于目标样本，统计出高频中心词用来概括目标样本中主要描述的对话内容。

3.意图识别。识别出客户语句的意图，以便进行相应的功能操作、信息推荐等。

4.多语种情绪识别。情绪识别是对包含主观信息的文本进行情感倾向性判断，正向或者负向（如果能提供训练数据集，可以识别更多种类的情绪）。为客户之声下游任务的口碑分析、话题监控、舆情分析等应用提供帮助。目前支持中文、粤语的情绪识别。根据情绪标识，用情绪进行搜索和统计分析。

5.文本聚类。文本聚类将一大段文本中心词和中心词的关联词、近义词生成一个图，用于可视化文本的内容。

6.自定义分词、意图。对分词分词、意图种类进行增删、扩展、微调等。