她只能给出第一条依据文字转WAV音频