因为他们拍下的录像又是一片模糊文字转WAV音频