需要以一种真实的方式捕捉演员全程的表演文字转WAV音频