他大概的计算了一下位置文字转WAV音频