所以他已经猜到文字转WAV音频