而是采用的单列纵队文字转WAV音频