而且还用了商量的口气文字转WAV音频