学习速率和收敛
这是一系列 Playground 练习中的第一个练习。 Playground 是专为本课程开发的教程,旨在讲解机器学习原理。
每个 Playground 练习都会生成一个数据集。此数据集的标签具有两个可能值。您可以将这两个可能值设想成垃圾邮件与非垃圾邮件,或者设想成健康的树与生病的树。大部分练习的目标是调整各种超参数,以构建可成功划分(分开或区分)一个标签值和另一个标签值的模型。请注意,大部分数据集都包含一定数量的杂乱样本,导致无法成功划分每个样本。
点击即可查看关于模型直观图示的说明。
此练习的界面提供了 3 个按钮:
图标 | 名称 | 用途 |
---|---|---|
Reset(重置) | 将 Iterations 重置为 0。重置该模型已学习的所有权重。 | |
Step(步) | 展开一次新的迭代。对于每次迭代,模型都会发生变化,有时是细微变化,有时是巨大变化。 | |
重新生成 |
Regenerate(重新生成) | 生成一个新数据集。不会重置 Iterations。 |
在这第一个 Playground 练习中,您将通过执行以下两个任务来尝试不同的学习速率。
任务 1:注意 Playgroud 右上角的学习速率菜单。指定学习速率为 3,这个值非常高。通过点击“步”按钮 10 或 20 次,观察这种较高的学习速率会如何影响您的模型。在早期的每次迭代之后,请注意模型的直观图示如何急剧变化。模型似乎已收敛后,您甚至可能看到出现不稳定的情况。另请注意从 x1 和 x2 到模型直观图示之间的线。这些线的权重表示模型中相应特征的权重。也就是说,线越粗,权重越高。
任务 2:执行以下操作:
- 按重置按钮。
- 降低学习速率。
- 多次按“步”按钮。
较低的学习速率对收敛有何影响?了解模型收敛所需的步数,并了解模型收敛的顺滑平稳程度。尝试较低的学习速率。能否发现因过慢而无用的学习速率?(您将在练习的正下方找到相关讨论。)