其实他根本没有拍摄文字转WAV音频