但他们确实是在握手文字转WAV音频