在没办法分辨准确数目的情况下文字转WAV音频