17 Matching Annotations
  1. Jun 2026
    1. Our main thesis is to keep the scaffold light and easy to change so the intelligence of the model is tested, rather than the ingenuity of the scaffold

      这是整个项目最重要的设计哲学,也是最有争议的赌注。大多数AI智能体系统的成功来自精心设计的脚手架——复杂的提示工程、分步骤工作流、大量错误处理逻辑。Andon Labs反其道而行:最小化脚手架,让模型内在能力暴露出来。这既是测试方法论,也是关于AI发展路径的信仰声明:如果模型足够强,它应该能在结构少的情况下工作。

  2. May 2026
    1. By combining signals from our Imagery, Population and Environment models and datasets, we achieve higher predictive accuracy on real-world classification and forecasting tasks versus a single modality analysis.

      多模态模型组合比单一模态分析具有更高的预测准确率,这一发现强调了跨模态融合在提升预测能力方面的重要价值。

  3. Apr 2026
    1. New Anthropic Fellows Research: a new method for surfacing behavioral differences between AI models.

      令人惊讶的是,Anthropic将软件开发中的'差异比较(diff)'概念首次系统性地应用于AI模型行为分析,这标志着AI评估方法的重要转变。这种跨领域的技术迁移为开源模型比较提供了全新视角,可能彻底改变我们对AI模型间细微差异的理解方式。

  4. Oct 2025
    1. 如果你没中子宫彩票,那么选择并从事一份职业将是人生绕不过去的课题。今天的“职业”似乎成了万恶之源,因为“工作就是为了不工作”,“努力是为了不努力”。今天的年轻人,人生目标出奇的一致:财务自由。我希望本期节目能完成一个论证:财务自由是一个让你输在起跑线上的糟糕目标。以它为目标,很可能会导致你财务严重不自由。 通常理解是:从事一份职业,是把自己当成商品,通过出售自己的时间和精力来换取报酬。更抽象地说,“职业”是通过解决他人问题来解决自己问题的生存模式,这是商业分工导致的必然结果。问题A与问题B的汇率是不同的,一名患者的致命问题,对一名医生而言可能只是一个常规问题,之间巨大的知识差,让前者愿意倾家荡产换取。生死问题比清洁问题重要,医生待遇比环卫工人更好。

      研究绝大多数人都绕不开的一个的重要话题——职业。那么我们应该如何才能认知职业的本质,让我们从本质、底层逻辑层面进行深刻理解。进而深刻的理解他、认知他、掌握它、运用它? 职业是一种生存模式,是一种解决自身问题的生存模式,目标是解决自身的生存问题的模式。但是这种模式必须要进行连接,要将自己的能力、目标与他人进行连接,才能形成并建立一种稳定的联系。 例如:医生是将自己的技能与患者之间的需求进行一种一对多的映射联系,企业家是将自己的综合能力与社会上更加广泛的人们需求建立联系,一个成功的企业家,自然它的服务受众也会约广泛,例如:库克、马斯克、马云。 结论:职业是一种将自己与他人建立联系并解决自身生存问题的生存模式。 职业的价值大小、能力的强弱,评价指标就是自己的职业范畴服务、联系的人员数量人员范畴的人员规模大小,联系强度的强弱。

    2. 关于赚钱的「观念」、「意愿」和「能力」是三回事,它们息息相关,但不能混为一谈。观念不同,会导致意愿的天差地别,意愿不同,则会使得养成的能力大相径庭。很多人有钱,就是因为足够贪婪,足够贪婪的同时又足够愚妄,以至于能完美自欺,彻底认同主流意识形态,没有一丝自我怀疑,冒进的风险偏好配合正常的智力,在特定历史阶段下就能赚到大钱,所谓“傻有钱”就是这么来的。我称之为“傻子钱”,不是说坑傻子赚到的钱,而是通过「未经反思的观念和意愿」赚到钱的这个人,在爱智的意义上就是个“傻子”。

      观念、意愿和能力,他们三者之前到底有什么样的区别和联系?他们在赚钱这个核心的目标实现过程中分别扮演什么样的角色和作用? 那么在赚钱的这个目标过程中,是否有底层逻辑、原理是通行、通用的,有没有相对稳定的模型、规则是适用统配的?有没有具体的措施、案例可以印证? 从而让赚钱这件事情,看上去更加通透、触及本质。

  5. Dec 2023
    1. 当然,短期来看领先的闭源模型相较于开源模型,护城河仍然十分清晰。东北大学教授肖桐认为,相较于开源模型,走闭源路线的大厂在人才、组织以及数据三个方面有短时间难以取代的优势。大厂往往拥有更高密度更高水平的人才,以及有经验的团队能够协调人才和高性能设备,并且能够拥有其他人无法拿到数据。此外,曾国洋还提到,大厂往往也拥有充足算力。“但长期来说的话,数据和算力各种要素都会慢慢追平”。在这个过程中,开源模型真正的影响力在于对生态系统的构建。“Llama2 可能会推动大模型上下游进行整合,一旦解决了规模的问题,成本也将大大下降”,肖桐表示。虽然目前 Llama2 仅仅可能是大模型开源生态系统的开端,“大家对 Llama2 的能力边界不是非常清晰,生态系统的形成同样需要一些时间”。但随着 Llama2 的释出,开源社区的技术能力被带上另一个台阶,大模型开源社区的力量已经无法被忽视。

      根据过往经验,长期来看,开源很可能会胜出,语言大模型很可能也是如此

  6. Dec 2022
  7. Aug 2022
  8. Jul 2022
  9. Apr 2022
    1. 使用了消息队列的方案(具体实现见 comm/messagequeue 目录),把绝大多数非阻塞操作放到消息队列里执行。并且规定,基础组件与调用方之间的交互必须1. 尽快完成,不进行任何阻塞操作;2. 单向调用,避免形成环状的复杂时序。消息队列的引入很好的改善了死锁问题,但消息队列的线程模型中,我们还是不能避免存在需要阻塞的调用,例如网络操作。在未来的尝试中,我们计划引入协程的方式,将线程模型尽可能的简化。

      线程模型、 消息队列、 非阻塞操作、 基础组件、 调用方、 单向调用、 环状的复杂时序。

      消息队列的线程模型。

      阻塞的调用,如:网络操作。

      阻塞,与非阻塞的区分,是在于哪里?

    Tags

    Annotators