但他们最起码知道文字转WAV音频