然后混合肉干文字转WAV音频