10月24日,一年一度的人工智能盛会——科大讯飞全球开发者节在安徽合肥举行。开发者大会现场,科大讯飞AI研究院常务副院长刘聪揭秘了科大讯飞卫冕夺冠的背后故事——独创的最新智能识别、合成与翻译技术。 科大讯飞在业内取得了一系列辉煌成绩,仅今年便有多项赛事夺冠。6月,在ICDAR2019公式识别的比赛中,科大讯飞一举获得在线和离线识别两项冠军;8月,在国际语音合成大赛暴风雪比赛中,科大讯飞以独创性听感量化编码框架和GAN建模技术将自然度得分刷新至4.5MOS分历史新高,卫冕夺冠。 科大讯飞AI研究院常务副院长刘聪介绍说,在语音识别核心算法上,基于深度全序列卷积神经网络(Deep Fully CNN),科大讯飞创新研发出了高精度的记忆增强式多通道端到端语音识别技术。并通过分析语音输入、语音交互和语音记录这三大典型应用场景,不断实现语音识别的真正落地。与此同时,基于语义分割与自适应感受野的通用图文识别核心技术,加速OCR的本地化布局,通过“云+端”的模式为用户提供更好的产品体验。此外,刘聪表示,融合领域知识的多通道半监督约束编解码翻译技术,提升专业术语词和行业翻译专业性,是科大讯飞通过CATTI专业测试的核心算法秘诀。 |