a lot of the improvements does not come from new algorithms. It comes from finding small bugs here and there in the data pipeline, in the model training pipeline.
大多数人认为模型性能的提升主要来自于算法创新和架构改进,但作者认为最大的提升往往来自于数据管道和训练管道中的小错误修复。这挑战了人们对AI模型开发过程的主流认知,暗示了工程优化可能比算法创新更重要。