On average Claude models have an SWE-ECI 2.7 points higher than their general ECI, and a Math-ECI 1.8 points lower.
这个数据点显示了Claude模型在软件工程和数学领域的表现差异。2.7分的软件工程优势和1.8分的数学劣势表明Claude确实在软件工程方面表现相对更好,而在数学方面相对较弱。这种差异虽然不算巨大,但方向性明显,与文章标题的论点一致。数据来自多个模型的平均值,具有一定统计意义。