实验中遇到的难题是他解决的文字转WAV音频