实际上他们心理也确实是相信了文字转WAV音频