NVIDIA 在线研讨会
演讲简介
语音合成技术可以将任何文字信息转换成标准流畅的语音且进行朗读,相当于给机器装了一张人工合成的“嘴巴”。它是涉及多个学科,如声学、语言学、数字信号处理和计算机科学的一个交叉学科。
NeMo 是一个用于构建先进的对话式 AI 模型的工具包,它内置集成了自动语音识别 (ASR)、自然语言处理 (NLP) 和语音合成 (TTS) 的模型及方法,方便调用先进的预训练模型快速完成对话式 AI 中各类子任务。我们通过 NeMo 可以快速方便的实现文字与语音之间的转换,让你的文字会说话!
面向听众:本次在线研讨会主要面向对会话式人工智能感兴趣的零基础编程爱好者。
通过本次在线研讨会,您可以获得以下内容:
> 语音合成技术简介
> 语音合成技术的工作流程与原理
> 语音合成技术中的深度学习模型
> 代码实战:使用 NeMo 快速完成自然语音生成任务
演讲者
李奕澎
NVIDIA 开发者社区经理
拥有 4 年数据分析建模开发经验,3 年人工智能自然语言处理开发经验。在自动语音识别、自然语言处理、自然语言理解等技术有着丰富的实战经验与见解。