还真的可以区分出不同的种类文字转WAV音频