只捕捉到十九位文字转WAV音频