现在的问题就是如何的去认知了文字转WAV音频