所以不可能完全准确文字转WAV音频