似乎为证明自己刚才确实在听文字转WAV音频