如果可以克服这两种前提的话……文字转WAV音频