    1. "SPRING: GPT-4 Out-performs RL Algorithms byStudying Papers and Reasoning"

    2. Quantitatively, SPRING with GPT-4 outperforms all state-of-the-art RLbaselines, trained for 1M steps, without any training.

      Them's fighten' words!

      I haven't read it yet, but we're putting it on the list for this fall's reading group. Seriously, a strong result with a very strong implied claim. they are careful to say it's from their empirical results, very worth a look. I suspect that amount of implicit knowledge in the papers, text and DAG are helping to do this.

      The Big Question: is their comparison to RL baselines fair, are they being trained from scratch? What does a fair comparison of any from-scratch model (RL or supervised) mean when compared to an LLM approach (or any approach using a foundation model), when that model is not really from scratch.

    1. 13.19%

      that's a lot!

    2. The Bloom filterswere constructed such that the false positive rate is upperbounded by 1108 . We further verified the low false positiverate by generating 1M strings, of which zero were found bythe filter

      Bloom filters used to determine how much overlap there is between train and test set, to be more sure of their results.

    1. Mettre en place des outils permettant d’évaluer les moyens nécessaires à la mise en œuvreeffective des politiques publiques en faveur de la protection de l’enfance, et s’assurer que lescrédits nécessaires soient affectés conformément aux résultats de cette évaluation.
    2. Procéder à une évaluation nationale des informations recueillies à l’échelon départementalsur les défaillances et dysfonctionnements des établissements de protection de l’enfance, enlien avec les rapports de contrôle et d’audit de ces établissements, afin de disposer d’uneconnaissance précise des difficultés récurrentes rencontrées et de définir les moyens deprévention et d’accompagnement des établissements les plus efficaces.
    3. Adopter, pour toutes les structures qui accueillent ou prennent en charge des enfants, desoutils d’évaluation de leur dispositif de participation des enfants et du recueil de leur parole.
    1. L’évaluation du travail doit découler de l’appréciation du travail uniquement : si la copie d’un élève mérite 19, il doit obtenir 19, même si c’est un perturbateur. Par contre, cela n’empêche pas l’enseignant de lui mettre une heure de colle pour son comportement !
      Recommandation 06

    1. Recommandation 28. Encourager une évaluation des savoirs des élèves sur l’éducation à la sexualité
    2. Recommandation 26. Établir une analyse annuelle académique de l’éducation à la sexualité, notamment àpartir des bilans fournis par les directions des services académiques de l’éducation nationale.
    1. Given all that madness, the need for critical thinking is obvious. But so is the need for critical ignorance — the skill, tuned over time, of knowing what not to spend your attention currency on. It’s great to be able to find the needle in the haystack — but it’s also important to limit the time spent in hay triage along the way.
    1. To be a successful physicist requires mastering how to make all 29 decisions, but the reflection decisions (decisions 23–26) are arguably the most difficult to learn.

      Of the 29 problem solving decisions identified as important the three "reflection decisions" (23-26 in the list) may be the most difficult to learn as they require metacognition and self-evaluation.

    2. why is there so little correlation between students’ performance in their physics courses and their ability to do physics research?
    1. Kahne and Bowyer (2017) exposed thousands of young people in California tosome true messages and some false ones, similar to the memes they may see on social media
    1. ReconfigBehSci. (2020, November 5). @ToddHorowitz3 2/2 so I would prefer to treat this as an opportunity for empirical observation and learning. Evaluation should focus on trying to assess actual contribution, not a priori judgments. [Tweet]. @SciBeh. https://twitter.com/SciBeh/status/1324367278352355330

    1. Strategic, cost-efficient evidence-building relies onstrong data governance that facilitates the access, pro-tection, and use of program and other administrativedata to enable and support secondary uses, including for
    1. We first demonstrate that each StylEx attribute corre-sponds to clear visual concepts, and then show that these canbe used to explain classifier outputs on specific images

      Quantative evaluation criteria, see column on the right-hand side here.

    2. However, the three followingcriteria seem key to any such method

      Quantitative evaluation criteria.

      Summary of evaluation: The eight white clergymen who wrote this letter to civil rights leaders missed an opportunity by not using the Rogerian structure. Classical oration left their audience feeling not heard and not understood. This combined with only first-hand qualitative evidence and several insulting logical fallacies makes for a letter just asking for Martin Luther King's scathing response.

    1. Once we introduce evaluation into our learning spaces, we change the way we interact with student work.

      Evaluation is not the same as feedback. Evaluation is almost always directed at unsolicited advice. Feedback may praise or criticize, but usually seeks value in something.

    1. À Singapour, où la profession est très valorisée, les enseignants sont évalués chaque année sur le fondement de leur contribution au développement personnel et académique des élèves, de leur collaboration avec les parents et le reste de la communauté, ainsi que leur contribution au travail collectif au sein de l’établissement. Les enseignants les plus performants reçoivent une prime sur cette base.
    1. he first criterion of adequacy in this approach is that the active voice of the subject should be heard

      is the interpretation adequate? criteria for answering the question of adequacy is outlined. 1) not objectifying 2) theoretical underpinning must allow for interpretation of the social dynamic of observer-subject. 3) The theoretical reworking has to allow for the revelation of underlying social structures.



    1. Haber, N. A., Wieten, S. E., Rohrer, J. M., Arah, O. A., Tennant, P. W. G., Stuart, E. A., Murray, E. J., Pilleron, S., Lam, S. T., Riederer, E., Howcutt, S. J., Simmons, A. E., Leyrat, C., Schoenegger, P., Booman, A., Dufour, M.-S. K., O’Donoghue, A. L., Baglini, R., Do, S., … Fox, M. P. (2021). Causal and Associational Linking Language From Observational Research and Health Evaluation Literature in Practice: A systematic language evaluation [Preprint]. Epidemiology. https://doi.org/10.1101/2021.08.25.21262631

    1. Since it was founded by longtime charity executive Pierre Barnoti as the international offshoot of a Montreal animal welfare charity, SPCAI has spent little more than 20 percent of its total revenue on actual programs and services that help animals.
    1. Gargano, J. W., Wallace, M., Hadler, S. C., Langley, G., Su, J. R., Oster, M. E., Broder, K. R., Gee, J., Weintraub, E., Shimabukuro, T., Scobie, H. M., Moulia, D., Markowitz, L. E., Wharton, M., McNally, V. V., Romero, J. R., Talbot, H. K., Lee, G. M., Daley, M. F., & Oliver, S. E. (2021). Use of mRNA COVID-19 Vaccine After Reports of Myocarditis Among Vaccine Recipients: Update from the Advisory Committee on Immunization Practices — United States, June 2021. MMWR. Morbidity and Mortality Weekly Report, 70(27), 977–982. https://doi.org/10.15585/mmwr.mm7027e2

    1. A falsey return value from #validate will deviate the flow and go straight to End.fail_fast.

      Similar to: How, in Rails, aborting a before_action causes all later ones to be skipped.

    1. Qualinclus, Guide d'auto-évaluation pour une école inclusive permet de nourrir la réflexion et les échanges pour les équipes pédagogiques et éducatives qui mettent en place une démarche d'auto-évaluation et d'amélioration continue de la qualité. Il s'adresse aux chefs d'établissement et à l'ensemble de la communauté éducative.

    2. à l'ensemble de la communauté éducative

      Qualinclus, Guide d'auto-évaluation pour une école inclusive permet de nourrir la réflexion et les échanges pour les équipes pédagogiques et éducatives qui mettent en place une démarche d'auto-évaluation et d'amélioration continue de la qualité. Il s'adresse aux chefs d'établissement et à l'ensemble de la communauté éducative.

    1. Les guides et les fiches Qualéduc Des guides proposent des fiches Qualéduc sur différents thèmes. Celles-ci ont été élaborées par les établissements, les académies (référents Qualéduc, groupes de travail ad-hoc, corps d’inspection…), les groupes de travail nationaux en charge de la rédaction de vadémécums dans le cadre de la voie professionnelle ou encore des personnes et bureaux ressources identifiés.

      Qualéduc 2020 : 31 fiches sur la transformation de la voie professionnelle, les enseignements et la pédagogie, de la vie dans l’établissement. Ce guide inclut la mise à jour du guide édité en 2017. Qualéduc Mobilités 2019 : 44 fiches sur la co-construction d’une culture qualité, le parcours de l’élève, le lien école-entreprise. Le projet Qualéduc Mobilités mené de 2017 à 2019 a permis à des équipes académiques d’observer les pratiques dans cinq pays européens innovants dans le domaine de l’assurance qualité dans l’enseignement et la formation professionnelle. Qualinclus pour une école inclusive (2018) ; Qualéduc EFE : fiches à destination des établissements de l’enseignement français à l’étranger ; Autres fiches thématiques : fiches proposées au fur et à mesure de leur élaboration et de leur validation.

    2. Sur l'ensemble des fiches d'évaluation de la qualité, peut concernent les familles, et aucune ne semble faire référence aux représentants de parents élus et délégués, spécifiquement

    3. Fiche 3.9 – Agir sur le climat scolaire et la qualité de vie dans l’établissement
    4. Fiche 3.6 -  Travailler la communication interne au sein de l’établissement

      C'est le seul point ou l'on voit apparaitre à la marge les parents d'élèves. et aucunement des RPE et de leurs associations.

      voici les points cités comme à vérifier • Faciliter l’appropriation de l’information diffusée pour les personnels et les usagers : taux de sollicitation pour demander des informations au sujet de questions ayant déjà fait l’objet d’une communication, taux de réponses aux sollicitations de l’établissement avant d’éventuelles relances…

      • Indicateur de visibilité : nombre de connexion à l’ENT de l’établissement, nombre de contributeurs internes au site et autres outils de communication…
      • Indicateurs relatifs aux familles : taux de participation aux élections du conseil d’administration, aux réunions parents/professeurs, aux différentes actions, groupes de travail ou manifestations auxquelles elles sont invitées.
      • Indicateurs d’enquêtes de satisfaction (construites en interne).
      • Identification claire par l’ensemble des membres de la communauté scolaire des « référents communication » de l’établissement.
    1. On peut remarquer qu'il n'est aucunement question de santé ou de la place des parents et de leurs représentants dans cette évaluation de l qualité



    1. Qualéduc Qualéduc est un outil mis à disposition des établissements et des corps d'inspection pour développer une démarche d'assurance qualité fondée sur l'amélioration continue. Mis à jour : décembre 2020
    1. Recommandation 14 Le Défenseur des droits recommande à toutes les structures qui accueillent ou prennent en charge des enfants de se doter d’outils d’évaluation de leur dispositif de participation des enfants et du recueil de la parole des enfants. L’opinion de l’enfant doit être recueillie dans le cadre de l’évaluation de ces outils.
    1. Le rôle du directeur d'école ou du chef d'établissement : mise en place et suivi du PAP Le PAP est élaboré - comme le PAI - sous la responsabilité du directeur de l’école ou du chef d’établissement. Il comporte deux modalités qui sont aussi celles du PPS : - premièrement, celle du partenariat : le PAP exige la participation des parents mais aussi le concours des professionnels qui suivent l’enfant et qui sont invités aux réunions d’élaboration et de suivi ; - et deuxièmement celle de l’évaluation et du suivi. Le responsable de la mise en oeuvre du PAP – le directeur d’école ou, dans le second degré, le professeur principal – doit procéder chaque année à une évaluation des progrès réalisés par l'élève ; il doit veiller aussi à la bonne transmission du dossier du PAP lors d’un changement d’établissement. Circulaire n°2015-016 du 22-1-2015 2. La procédure de mise en place
    1. Important caveat: in the combined expression, if the middle command has a non-zero exit status, then both the middle and the rightmost command end up getting executed.

      I don't think that is surprising, is it? Since && and || have the same order of precedence. So I think this is more of a clarification than a caveat.

      I think this is just because:

      a && b || c is equivalent to: (a && b) || c (so of course c gets evaluated if (a && b) is false (that if either a or b is false).

      I think they just mean, in this case:

      bedmap && mv || fail

      if mv fails, then fail still gets executed.

      Easier to see with a simpler example:

      ⟫ true && false || echo 'fail'
      ⟫ false && true || echo 'fail'

      Better example/explanation here: https://hyp.is/-foxmCVXEeuhnLM-le_R4w/mywiki.wooledge.org/BashPitfalls

      The caveat/mistake here is if you treat it / think that it is equivalent to if a then b else c. That is not the case if b has any chance of failing.

    1. The potential problem: if second_task fails, third_task will not run, and execution will continue to the next line of code - next_task, in this example. This may be exactly the behavior you want. Alternatively, you may be intending that if second_task fails, the script should immediately exit with its error code. In this case, the best choice is to use a block - i.e., curly braces: first_task && { second_task third_task } next_task Because we are using the -e option, if second_task fails, the script immediately exits.
    2. When people write COND && COMMAND, typically they mean "if COND succeeds (or is boolean true), then execute COMMAND. Regardless, proceed to the next line of the script." It's a very convenient shorthand for a full "if/then/fi" clause.
