这就不是简单的追踪了文字转WAV音频