多半是他凭借计算力强行模拟出来的文字转WAV音频