ASR-语音识别ASR-小善科技（ShanTech AI）

ASR自动语音识别

企业级电话录音转写&实时语音识别

专注于销售和客服通话语音

实测准确率高于行业巨头

在某数百亿市值客户的测试中，小善科技的语音识别准确率高于国内公认语音巨头 X 厂和互联网巨头 T 厂，其中语音识别错误率，X 厂比我们高 3.96%，T 厂比我们高 19.68%；说话人分离的错误率，X 厂比我们高 27.87%，T 厂比我高 46.54%。

实测数据

语音降噪

模型压缩

说话人识别准确率，远高于行业水平

因为节省存储成本的考虑，很多企业采用单轨录音。小善科技通过自研的说话人分离技术，对单轨录音中的说话人角色进行分类，为坐席沟通质检与客户心声分析提供技术基础。在客户的实际测试中，我们的说话人识别错误率低于行业巨头 25% 以上。

沟通质检

说话人分离

低延时

高并发通路

小善科技提供实时的电话语音转写为文字服务，支持 MRCP 等主流传输协议，8K 采样率。在维持高准确率、高并发通路数的基础上，我们的端到端延时低于 500ms，当前行业实际平均水平在 500ms 之上。

支持高并发、低延时的实时转写

采用原创的底层算法模型

小善科技联合创始人杨林林Google、卡内基梅隆大学，合作推出国际前沿的原创算法模型 Transformer-XL，并在全部六个主流语言建模数据集上取得 state of the art 结果。小善科技率先将该模型应用于企业级语音识别系统，实现准确率更高的端到端语音识别。

全部六个数据集

state of the art

端到端识别

相对位置编码

循环机制

提供行业专属模型，获标杆客户商业订单

在金融、教育、互联网服务等领域，小善科技依靠先进的算法模型、几十万小时的训练数据积累实现多个行业的专属识别模型，并获得包括众安保险、玖富、新东方在线、VIPKID、58同城、猎聘等在内的标杆客户数十万至数百万级商业订单。

专属模型

商业订单持续增长

我们服务的客户

支持私有部署和自定义专有名词

您可以选择 SaaS 模式，也可以选择本地的私有部署或者云端的私有部署模式。我们将根据实际业务量，即每日电话录音时长，为您推荐高效的云端或本地服务器配置。小善科技的 ASR 引擎支持自定义企业专有名词，提升转写文本的准确率。

支持专有名词

安全可靠

我们的产品