也就是我们通常意义的测量时文字转WAV音频