但他们也不会主动说出文字转WAV音频