关于“课程讨论”分类

这个分类用于用户课程讨论

提问:为什么从0开始实现线性回归中的sgd在训练时候无需对样本梯度求平均,而GLUON实现时候就需要step函数求平均?