实际上他使用转移术文字转WAV音频