不得不考虑到其他界文字转WAV音频