准确的说更偏向于白色文字转WAV音频