不过他说出的数字应该还是非常准确的文字转WAV音频