恐怕比第一个办法还要难以实现文字转WAV音频