它们不会去主动表态文字转WAV音频