那么才能确定他为什么会选择在这里出现的文字转WAV音频