他是没有办法考虑那么多的文字转WAV音频