然后采用沙哑的声音说到文字转WAV音频