这个过程就是三品到四品的转换文字转WAV音频