最后按照各家出力的多少来判定谁应该有文字转WAV音频