如果演员仅仅是将目标锁定在文字转WAV音频