基本上很难做到约束文字转WAV音频