全新研制的多轮对话 SDS 构件,具备更高的泛化能力和鲁棒性;
采用更多的语音层面信息,使得语音直接进行语义解析的方案更加完善;
核心算法的整体重构,使得多轮对话中的严重错误降到历史最低水平,对话系统更加稳定可靠。
传统语言学理论和纯机器学习理论的完美融合,大幅提升了语言合成的自然度和表现力;
多角色混合建模结合少量数据迁移学习技术,可快速构建高自然度的多音色合成系统;
深度定制的新型神经网络波形重构技术,在保持极快的合成速度的前提下仍具备极高的合成音质。
采用领先的 DeepCNN 深度学习模型框架,大幅提升复杂发音环境下的声学建模能力;
结合超大规模端到端语言模型技术,实现电话信道口语语音识别能力的显著提升;
独特的同步解码技术 + 全局回溯纠错技术,在实现实时听写功能的同时不损失识别精度。