2 Matching Annotations
  1. May 2026
    1. Experiments across six game environments show that COSPLAY with an 8B base model achieves over 25.1 percent average reward improvement against four frontier LLM baselines on single player game benchmarks while remaining competitive on multi player social reasoning games.

      在六个游戏环境中进行的实验表明,COSPLAY框架在单人游戏基准测试中,与四个前沿的LLM基线相比,平均奖励提高了25.1%,同时在多人社交推理游戏中也保持了竞争力。

  2. Jan 2023
    1. 父母生活上太节俭,不劝,想改善他们生活,就说自己想吃;想改善他们的穿着,就说刚好遇到做活动,超低价!

      要实现同样一件事、一个目标、一种结果,同样的一种行为,但是换一种说法、换一种说辞,就会产生截然不同的效果。这就是言行不同组合,产生的奇妙效果。 不同的说辞、不同的说法、不同的理论支撑下,采取同样的一套行动,最终竟然会产生不同的、甚至是截然相反的效果。 这就虚实结合的奇妙案例。 不同的虚部,与同样一个实部组合,会得到截然相反的不同结果。 值得进一步深入思考。

    Tags

    Annotators