这里的确是多罗界文字转WAV音频