他们的数量都是几百计的文字转WAV音频