没有对细节的精准的把握和体察文字转WAV音频