4 Matching Annotations
  1. May 2026
  2. Apr 2026
    1. ADeLe evaluates models by scoring both tasks and models across 18 core abilities, enabling direct comparison between task demands and model capabilities.

      这一创新点令人惊讶,因为它将AI评估从简单的任务得分转向了多维能力评估,类似于人类认知能力的多维度测量。这种方法打破了传统AI评估的局限性,揭示了模型在不同能力维度上的真实表现,为AI系统提供了更精细的'认知图谱'。

    1. Sage intercepts tool calls (Bash commands, URL fetches, file writes) via hook systems in Claude Code, Cursor / VS Code, OpenClaw, and OpenCode, and checks them against:

      这个声明揭示了Sage的核心创新点——它通过多种平台的hook系统拦截并检查AI代理的工具调用,形成了一个跨平台的防护层。这种多平台集成能力令人印象深刻,表明它能够覆盖当前主流的AI开发环境,为用户提供统一的安全保障。

    1. A routine is a saved Claude Code configuration: a prompt, one or more repositories, and a set of connectors, packaged once and run automatically.

      这个定义揭示了Routines的核心创新点:它将Claude Code的能力封装成可重用的自动化单元,结合了提示、代码库和外部连接器。这种封装方式代表了AI辅助开发的一个重要进步,使AI能力能够被系统化地集成到工作流程中。