虽然没有办法确切统计文字转WAV音频