所以他提出建议文字转WAV音频