就是说话也都是将声音压的十分低文字转WAV音频