所以他还是觉得第二种更为合适一些文字转WAV音频