所以他才会先选择那位眼镜男子来讲解文字转WAV音频