用新旧两种模式结合的办法来演绎角色文字转WAV音频