杨锐的思路其实是非常粗暴的文字转WAV音频