专注于销售和客服通话语音

 

实测准确率高于行业巨头

 

在某数百亿市值客户的测试中,小善科技的语音识别准确率高于国内公认语音巨头 X 厂和互联网巨头 T 厂,其中语音识别错误率,X 厂比我们高 3.96%,T 厂比我们高 19.68%;说话人分离的错误率,X 厂比我们高 27.87%,T 厂比我高 46.54%。

实测数据

语音降噪

模型压缩

说话人识别准确率,远高于行业水平

因为节省存储成本的考虑,很多企业采用单轨录音。小善科技通过自研的说话人分离技术,对单轨录音中的说话人角色进行分类,为坐席沟通质检与客户心声分析提供技术基础。在客户的实际测试中,我们的说话人识别错误率低于行业巨头 25% 以上。

沟通质检

说话人分离

低延时

高并发通路

小善科技提供实时的电话语音转写为文字服务,支持 MRCP 等主流传输协议,8K 采样率。在维持高准确率、高并发通路数的基础上,我们的端到端延时低于 500ms,当前行业实际平均水平在 500ms 之上。

支持高并发、低延时的实时转写

采用原创的底层算法模型

小善科技联合创始人杨林林Google、卡内基梅隆大学,合作推出国际前沿的原创算法模型 Transformer-XL,并在全部六个主流语言建模数据集上取得 state of the art 结果。小善科技率先将该模型应用于企业级语音识别系统,实现准确率更高的端到端语音识别。

全部六个数据集

state of the art

端到端识别

相对位置编码

循环机制

提供行业专属模型,获标杆客户商业订单

在金融、教育、互联网服务等领域,小善科技依靠先进的算法模型、几十万小时的训练数据积累实现多个行业的专属识别模型,并获得包括众安保险、玖富、新东方在线、VIPKID、58同城、猎聘等在内的标杆客户数十万至数百万级商业订单。

专属模型

商业订单持续增长

支持私有部署和自定义专有名词

您可以选择 SaaS 模式,也可以选择本地的私有部署或者云端的私有部署模式。我们将根据实际业务量,即每日电话录音时长,为您推荐高效的云端或本地服务器配置。小善科技的 ASR 引擎支持自定义企业专有名词,提升转写文本的准确率。

支持专有名词

安全可靠

我们的产品