17 Matching Annotations
  1. Jun 2026
    1. an Environment module (EN) for automatic reset and verification, a Policy Improvement module (PI) that launches policy refinement, a Rollout module (R) to evaluate policies with single or multiple physical robots operating in parallel, and an Evolution module (E) in which coding agents analyze logs

      ENPIRE的四模块设计(EN-PI-R-E)是一个优雅的系统分解。关键在于E(Evolution)模块:智能体不只是执行预设的训练流程,而是分析失败日志、查阅文献、修改训练代码来应对失败模式。这是一种元级的自适应——系统不只是在数据上学习,还在算法上学习。这与AAR论文中自主研究的思路高度一致,但ENPIRE把它落地到了有物理约束的机器人场景。

    1. We deliberately scoped this work to a legitimate medicinal-chemistry problem...The experiments did not involve toxins, chemical weapons, or requests to design harmful compounds

      这段话是OpenAI在化学AI能力领域做了一件重要事情:主动划定边界,并公开解释为什么这个结果不应该被外推到有害应用。在AI化学能力引发广泛担忧的背景下,这种主动的能力框架说明——而不是回避讨论——是更负责任的发布方式。它同时也设定了一个可问责的标准:如果未来结果被滥用,这段话就成了对照基准。

  2. Dec 2022
  3. Dec 2020