而且他们的声音也是刻意压低文字转WAV音频