他们能知道这一点就已经足够了文字转WAV音频