然后主动问了话文字转WAV音频