这种方法需要超强的反应力以及精准的控制文字转WAV音频