20+ world-class open-source developers built realistic, diverse, and challenging coding tasks from the repos they maintain, spending more than 40 hours per task.
这个数据点表明每个任务投入了大量专业时间和人力,40小时/任务的开发成本远高于典型基准测试,这反映了FrontierCode对高质量评估的承诺。然而,没有提供总开发成本或参与者的具体身份,难以验证这些开发者的真实水平和代表性。