**本质:**seq2seq的模型——输入一个序列的向量作为input,output的长度由机器自己决定

seq2seq's model 它是一个,很powerful的model,它是一个很有用的model

应用

1. 语音辨识

Untitled

输入是声音讯号的一串的vector,输出是语音辨识的结果,也就是输出的这段声音讯号,所对应的文字⇒输出的长度由机器自己决定,

2. 机器翻译

Untitled

机器读一个语言的句子,输出另外一个语言的句子,

输入的文字的长度是N,输出的句子的长度是N',那N跟N'之间的关系,也要由机器自己来决定

3.语音翻译

Untitled

把他听到的英文的声音讯号翻译成中文文字

(动机:世界上有很多语言,他根本连文字都没有,不能用1.+2.串接)

训练数据:乡土剧语音+字幕

新词:硬train一发

4.语音合成Text-to-Speech (TTS) Synthesis

Untitled

输入文字 输出声音讯号