所以也比在场其他人更加清楚文字转WAV音频