但却随即又提出了附加条件文字转WAV音频