整个过程都是由他來主导操作的文字转WAV音频