我知道他们原本也抽调了人手文字转WAV音频