也就是要有足够的心法文字转WAV音频