3 Matching Annotations
  1. Last 7 days
    1. ADeLe evaluates models by scoring both tasks and models across 18 core abilities, enabling direct comparison between task demands and model capabilities.

      这一创新点令人惊讶,因为它将AI评估从简单的任务得分转向了多维能力评估,类似于人类认知能力的多维度测量。这种方法打破了传统AI评估的局限性,揭示了模型在不同能力维度上的真实表现,为AI系统提供了更精细的'认知图谱'。

    1. Sage intercepts tool calls (Bash commands, URL fetches, file writes) via hook systems in Claude Code, Cursor / VS Code, OpenClaw, and OpenCode, and checks them against:

      这个声明揭示了Sage的核心创新点——它通过多种平台的hook系统拦截并检查AI代理的工具调用,形成了一个跨平台的防护层。这种多平台集成能力令人印象深刻,表明它能够覆盖当前主流的AI开发环境,为用户提供统一的安全保障。

    1. A routine is a saved Claude Code configuration: a prompt, one or more repositories, and a set of connectors, packaged once and run automatically.

      这个定义揭示了Routines的核心创新点:它将Claude Code的能力封装成可重用的自动化单元,结合了提示、代码库和外部连接器。这种封装方式代表了AI辅助开发的一个重要进步,使AI能力能够被系统化地集成到工作流程中。