大致便是两种想法文字转WAV音频