我们记住的可能只是一连串的符号文字转WAV音频