核心技术

 

语音识别

 

小善科技拥有全套自主知识产权的语音识别引擎,基于原创的Transformer-XL网络架构,实现语音至文本的端到端学习。通过自主研发的语音降噪和数据增广技术,语音识别模型的鲁棒性得到显著提升。原创模型压缩技术极大增强音频处理的吞吐率和实时性。完美支持私有化部署及行业专属模型定制。

多垂直场景
精确识别

深度语义解析 

支持实时识别

声纹识别

在沟通语音中,单轨录音数据中常包含多个说话人的声音。小善科技使用原创的深度学习模型对单轨录音从时域上进行分离,基于声纹信息判断说话人性别、身份,实现“闻声识人”。通过自然语言处理技术,对说话人角色进行分类,为坐席沟通质检与客户心声分析提供技术基础。

国际前沿的
声纹引擎

完善的
声纹安全方案

语气识别

语音中除了内容信息之外,还包含了丰富的情绪语气信息。小善科技基于序列神经网络模型,对语音对话中的开心、愤怒、惊讶、厌恶等情绪信息,以及停顿、语速、打断对话等沟通质量指标进行识别,从而全方位多角度的对坐席沟通过程进行监督,并对客户的意向、满意度进行监测。

精准情绪识别

全方位对话分析

自然语言理解

小善科技团队发明了原创算法XLNet,是国际前沿的自然语言理解算法,在20项标准数据集上超越了谷歌BERT。XLNet实现了精准自然语言理解,对沟通对话数据进行精确画像挖掘和心声分析,准确率远超传统方法。

国际前沿技术

适配所有自然语言理解任务

多垂直场景
专业优化

结构化画像精准抽取

推荐系统 

小善科技打造了基于深度学习的自研推荐系统。该系统相比于市面系统主要有两大优势:

1、 从沟通数据中提取丰富的结构化画像,并和XLNet等深度学习方法进行有效融合。

2、在传统行为数据之外引入了沟通数据,信息密度更大,表现更好。

基于该技术,小善科技的推荐系统对线索转化率提升3倍以上

适配所有行业

3倍以上转化率提升