现在基本上确定主要位置文字转WAV音频