然后咱们搜集线索文字转WAV音频