这是一个非常理想化的计划文字转WAV音频