人数的劣势就会暴露文字转WAV音频