只是在具体的含量上面有着区别文字转WAV音频