你觉得他会不会是利用我们文字转WAV音频