他们这么做也有安全上的考虑文字转WAV音频