只是这个过程恐怕不是一般人能够承受的文字转WAV音频