最好采取蹲姿或者是坐姿文字转WAV音频