至少代表了一定的信任文字转WAV音频