他们可以在特定环境里模拟文字转WAV音频