从时间上判断出文字转WAV音频