avatar

目录
Azure 学习笔记 VIII —— Speech Translation

什么是 Azure Speech Translation

Azure Speech Translation 官网:https://azure.microsoft.com/en-gb/services/cognitive-services/speech-translation/

Azure Speech Translation,是 Azure Cognitive Service 中的一项 Speech Service,可以用 Azure 中已经预训练好的语言模型或者自定义的模型,来将源语言的音频转换为目标语言的音频,常用于同声翻译等场景,实时翻译语音。

Workflow

Azure Speech Translation 的工作流如下图所示,可以看到它主要由4个模块组成,包括前两篇文章提到过的 Speech to TextText to Speech 这两个模块用于输入和输出,Speech Correction 模块用于规范化文本(比如删除口头禅)并自动更正某些明显的语病,Machine Translation 模块进行文本翻译。

特点

Azure Speech Translation 具有以下特点:

  • 支持翻译 30 多种语言的音频
  • 神经网络机器翻译技术提供快速可靠的翻译
  • 自定义翻译:可定制模型以识别特定域的术语和独特的说话风格
  • 规范化文本:通过经过训练的引擎,自动规范化语音输出
  • 数据安全性:在处理期间不会记录任何语音数据

Custom Translator

Custom Translator 有利于我们训练自己的机器翻译模型,比如对于特定场景,使用通用翻译模型,在特定词句或语序上会有略微欠缺,这时候就需要我们自己去搜集并构造双语语料,并使用 Custom Translator 进行训练,以期取得更好的翻译效果。


首页:Custom Translator
官方文档:Official Doc

数据集

Custom Translator 的数据集为双语对照的样本对,每一句话对应一个样本,以空行分开。

  • 本地准备的双语样本分别放在两个文本文件中,如下图所示:

  • 上传到 Custom Translator 后,会自动检测并分割语句,结果如下:

值得注意的是,训练 Custom Translator 需要的训练样本至少为10,000,也就是10,000对双语对照的样本对,否则无法训练。

文章作者: Reborn
文章链接: https://reborn8888.github.io/2020/12/30/Azure-8-Speech-Translation/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Reborn
打赏
  • 微信
    微信
  • 支付寶
    支付寶

评论