尝试着两种法则提前小规模融合文字转WAV音频