只能是尽力按照他的理解来进行说明文字转WAV音频