VALL-E利用离散编码技术将连续的语音特征表示转换为离散标记(token),从而利用类似语言模型的next-tokenprediction机制实现语音合成。VALL-E是一个Decoder-only的语音语言模型。



VALL-E利用离散编码技术将连续的语音特征表示转换为离散标记(token),从而利用类似语言模型的next-tokenprediction机制实现语音合成。VALL-E是一个Decoder-only的语音语言模型。

A、正确

B、错误

正确答案:A


Tag:语音 模型 语言 时间:2025-04-07 11:03:04

相关答案