所以他使用的一定是不同的手法文字转WAV音频