Azure 学习笔记 VIII —— Speech Translation

发表于 2020-12-30| 更新于 2021-05-07|学习笔记

字数总计:522|阅读时长: 1 分钟

|阅读量:

什么是 Azure Speech Translation

Azure Speech Translation 官网：https://azure.microsoft.com/en-gb/services/cognitive-services/speech-translation/

Azure Speech Translation，是 Azure Cognitive Service 中的一项 Speech Service，可以用 Azure 中已经预训练好的语言模型或者自定义的模型，来将源语言的音频转换为目标语言的音频，常用于同声翻译等场景，实时翻译语音。

Workflow

Azure Speech Translation 的工作流如下图所示，可以看到它主要由4个模块组成，包括前两篇文章提到过的 Speech to Text、Text to Speech 这两个模块用于输入和输出，Speech Correction 模块用于规范化文本（比如删除口头禅）并自动更正某些明显的语病，Machine Translation 模块进行文本翻译。

特点

Azure Speech Translation 具有以下特点：

支持翻译 30 多种语言的音频
神经网络机器翻译技术提供快速、可靠的翻译
自定义翻译：可定制模型以识别特定域的术语和独特的说话风格
规范化文本：通过经过训练的引擎，自动规范化语音输出
数据安全性：在处理期间不会记录任何语音数据

Custom Translator

Custom Translator 有利于我们训练自己的机器翻译模型，比如对于特定场景，使用通用翻译模型，在特定词句或语序上会有略微欠缺，这时候就需要我们自己去搜集并构造双语语料，并使用 Custom Translator 进行训练，以期取得更好的翻译效果。

首页：Custom Translator
官方文档：Official Doc

数据集

Custom Translator 的数据集为双语对照的样本对，每一句话对应一个样本，以空行分开。

本地准备的双语样本分别放在两个文本文件中，如下图所示：
上传到 Custom Translator 后，会自动检测并分割语句，结果如下：

值得注意的是，训练 Custom Translator 需要的训练样本至少为10,000，也就是10,000对双语对照的样本对，否则无法训练。

文章作者: Reborn

文章链接: https://reborn8888.github.io/2020/12/30/Azure-8-Speech-Translation/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Reborn！

Microsoft Azure Speech

微信
支付寶

相关推荐

Azure 学习笔记 VII —— Text to Speech

Azure 学习笔记 VI —— Speech to Text

Azure 学习笔记 V —— Personalizer

Azure 学习笔记 IV —— Cognitive-Search

Azure 学习笔记 III —— Azure App Service

评论

本地搜索

由 hexo-generator-search 提供支持