那是因为它并不来自于我们的位面文字转WAV音频