3 Matching Annotations
  1. Last 7 days
    1. models climb close to the average human baseline over the past year and a half.

      这个时间跨度(一年半)内AI系统接近人类平均水平的表现,显示了AI在基本常识推理方面的进步速度。这一数据点表明,虽然简单基准测试可能趋于饱和,但它们仍能揭示AI系统的局限性。

  2. Jul 2020
  3. Apr 2020