For the remaining cases, the full SELFDOUBT score significantly outperforms sampling-based semantic entropy at 10x lower inference cost.
令人惊讶的是:SELFDOUBT方法在处理剩余情况时,不仅显著优于基于采样的语义熵方法,而且计算成本降低了10倍。这一发现表明,通过分析模型推理过程中的自我怀疑和验证行为,可以在极低成本下实现比传统方法更准确的不确定性估计,为实际应用提供了高效解决方案。