用了足足五秒钟才计算出一个满意的坐标和角度文字转WAV音频