他给出的这个价值估算文字转WAV音频