他根据法则的精妙程度可以勉强判断出文字转WAV音频