他们两个需要做的就是先拖住这九个人文字转WAV音频