人们的注意力很自然就在这场秀本身上聚集文字转WAV音频