大部分都是选择了让位于下一代文字转WAV音频