得出的结论和我刚刚用听诊法得出的结论是相同的文字转WAV音频