基本上两者是一样的族群文字转WAV音频