也许他们会提出一系列的条件文字转WAV音频