Hypothesis

our predictions had a median multiplicative error of 1.5x

中位数乘法误差1.5x是什么概念？如果某个不良行为的真实发生率是10/100k，预测值会落在6.67/100k到15/100k之间。对于安全决策来说，这个精度已经足够判断方向（是否增加/减少）、排序风险优先级，以及决定是否部署。但尾部误差可达10x——这意味着对于某些行为，预测和现实可能相差一个数量级。OpenAI诚实地承认这个局限性，并指出主要误差来源是模拟环境保真度，而非提示分布偏移，这是一个值得追踪的工程改进方向。

1.5x误差预测精度安全决策

Tags

Annotators

URL