也明白那些没吭声的应该是曾经经历过的文字转WAV音频