1 Matching Annotations
  1. Jun 2026
    1. our predictions had a median multiplicative error of 1.5x

      中位数乘法误差1.5x是什么概念?如果某个不良行为的真实发生率是10/100k,预测值会落在6.67/100k到15/100k之间。对于安全决策来说,这个精度已经足够判断方向(是否增加/减少)、排序风险优先级,以及决定是否部署。但尾部误差可达10x——这意味着对于某些行为,预测和现实可能相差一个数量级。OpenAI诚实地承认这个局限性,并指出主要误差来源是模拟环境保真度,而非提示分布偏移,这是一个值得追踪的工程改进方向。