Hypothesis

3 Matching Annotations

Oct 2021
blog.csdn.net blog.csdn.net

【结合实例】信息增益的计算_guomutian911的专栏-CSDN博客_信息增益计算公式

1
1. Yannnan 15 Oct 2021
  
  in Public
  
  活跃度对用户流失的影响比性别大。
  
  优先分它能够让数据的Y分布变得更纯（信息熵更迅速变小）
Visit annotations in context

Annotators

Yannnan

URL

blog.csdn.net/guomutian911/article/details/78599450
Apr 2020
www.peterbloem.nl www.peterbloem.nl

Transformers from scratch | Peter Bloem

1
1. Yannnan 28 Apr 2020
  
  in Public
  
  For input 𝐱i\x_\rc{i} each attention head produces a different output vector 𝐲ri\y_\rc{i}^\bc{r}. We concatenate these, and pass them through a linear transformation to reduce the dimension back to kk.
  
  像是attention后面加了一个线性回归这样位置信息能被考虑进去
Visit annotations in context

Annotators

Yannnan

URL

peterbloem.nl/blog/transformers
Jan 2019
blog.csdn.net blog.csdn.net

带你理解beta分布 - Jie Qiao的专栏 - CSDN博客

1
1. Yannnan 15 Jan 2019
  
  in Public
  
  beta分布与二项分布的共轭先验性质
  
  在贝叶斯统计中，如果后验分布与先验分布属于同类，则先验分布与后验分布被称为共轭分布，而先验分布被称为似然函数的共轭先验。比如，高斯分布家族在高斯似然函数下与其自身共轭 (自共轭)。
Visit annotations in context

Annotators

Yannnan

URL

blog.csdn.net/a358463121/article/details/52562940