都无法在准确的捕捉到对方文字转WAV音频