问题是解说声音和游戏声音都是从同一个画面中传出来的文字转WAV音频