但是大致的总是能够猜测到一些的文字转WAV音频