16 Matching Annotations
  1. Last 7 days
    1. 与并行化的主要区别在于其灵活性 - 子任务不是预先定义的,而是由编排器根据特定输入确定

      不是静态预设的,而是动态生成的。

    1. 从大量数据(包括书籍、文章和网页)中吸收知识

      知识体现为掌握了一些基本概念及其含义

  2. Dec 2024
    1. 如果模型给出后备回答,请尝试提高温度。

      重要技巧!

    2. 使用不同的措辞

      不如说是不同的句型,如疑问句、祈使句等等,实际新的编程语法实际就是自然语言语法同样的任务可以用不同的语言和语法形式来实现

    3. Suggest a recipe for a pie.

      任务式(祈使句)

    4. How do I bake a pie?

      问答式(疑问句)

    5. 在每个词元选择步骤中,系统都会对概率最高的 top-K 词元进行采样。然后,系统会根据 top-P 进一步过滤词元,并使用温度采样选择最终的词元

      参数原理或执行机制

      • 先按照 top-k 设定选择范围
      • 在按照 top-p 设定概率(进一步)限制(选择范围)
      • 最后根据温度决定限定样本选择的随机性

      所以,原则上,只要 top-k 设为1,那么就把范围设定死了。而如果 top-k 设定的较大,那么可以通过 top-p 来剔除较小概率的候选词,最后,当两次过滤后,仍然有很多选项时,通过温度来决定筛选的原则和策略。

    6. 通过温度确定

      温度决定选择哪一个

    7. 在应用 topP 和 topK 时会生成响应

      top 决定采样策略

    8. 温度在生成响应期间用于采样

      温度决定采样区间

    9. 将提示细分为简单的组成部分

      分解思维

    10. 有时,让模型补全输入可能比用自然语言描述任务更容易

      非常重要!因为补全是模型的本能

    11. 如需使模型以特定格式返回大纲,您可以添加表示大纲开头的文本,并让模型根据您起头的模式补全大纲

      补全是一种重要的提示方法。

    12. 模型的回答可能会与示例过拟合

      过拟合的意思是过于侧重个别案例,而忽略了整体规律,也就是过于侧重差异性,而忽略了通用性。之所以太多实例会造成过拟合,原因就在于这些实例中所包含的差异会覆盖它们共通的部分,因而会使得模型无所适用,在不同的个案之前跳跃。

    13. 您可以在提示中添加指令和模型解决问题所需的信息,而不是假设模型具备所有必要信息

      不要假设模型无所不知,所以要向它提供与问题或任务有关的背景知识。

      大多数背景知识,实际都采用了可以直接回答问题的“正面”说明或答案方式。比如,如果问题是什么是气候变化?最直接的背景知识就是提供对气候变化的解释,比如气候变化是指什么什么等等。

      于是,所谓的 RAG实际就是根据问题在数据库中寻找答案,然后将找到的答案经过加工和润色反馈给用户

    1. 在庞大且多样化的训练集上进行训练也可以减少过拟合

      所谓过拟合实际就是数据的分布过于偏向某种特定的类型,而失去了潜在的多样性可能。