假设按照轨迹文字转WAV音频