神经网络Playground 练习

首个神经网络

在本练习中，我们将训练首个小型神经网络。借助神经网络，我们无需使用显式特征组合，便可学习非线性模型。

任务 1：给定模型将两个输入特征合并为一个神经元。此模型会学习任何非线性规律吗？运行该模型，以确认您的猜测是否正确。

任务 2：尝试将隐藏层中神经元的数量从 1 增加到 2，此外，尝试将线性激活更改为非线性激活（例如 ReLU）。您能否创建可以学习非线性的模型？

任务 3：通过添加或移除隐藏层和每层的神经元，继续进行实验。此外，您可以随时更改学习速率、正则化和其他学习设置。要使测试损失不超过 0.177，您可以使用的最少节点和层数是多少？

（答案位于练习下方。）

点击下拉箭头即可查看任务 1 的答案。

激活已设为线性，因此，此模型无法学习任何非线性。损失会非常大。

点击下拉箭头即可查看任务 2 的答案。

非线性激活函数可以学习非线性模型。不过，如果一个隐藏层具有 2 个神经元，则学习此模型需要一些时间。这些练习具有不确定性，因此，有些运行不会学习有效模型，而另一些运行则会完成得很不错。

点击下拉箭头即可查看任务 3 的答案。

Playground 的不确定性这一特性在本练习中有所体现。有些运行包含 3 个按如下方式排列的隐藏层，它们产生的测试损失非常小：

第一层有 3 个神经元。
第二层有 3 个神经元。
第三层有 2 个神经元。

但是，另一些具有相同配置的运行产生的损失却非常大。

神经网络初始化

本练习将再次使用 XOR 数据，但这次用于研究训练神经网络的重复性以及初始化的重要性。

任务 1：运行给定模型四到五次。在每次试验开始之前，请点击重置网络按钮，以获取新的随机初始化数据。（重置网络按钮是一个圆形重置箭头，位于“播放”按钮左侧）。让每次试验至少运行 500 步，以确保图形能收敛。每个模型输出会收敛为何种形状？对于初始化在非凸优化中发挥的作用，这说明了什么？

任务 2：尝试添加一层和几个额外节点，让模型变得稍微复杂点。重复任务 1 的试验。这是否可以提高结果的稳定性？

（答案位于练习下方。）

点击下拉箭头即可查看任务 1 的答案。

每次运行时，学习模型形成不同的形状。收敛的测试损失各不相同，最低值和最高值几乎相差两倍。

点击下拉箭头即可查看任务 2 的答案。

添加层和额外节点会产生更多重复的值。每次运行时，生成的模型看起来大致相同。此外，每次运行产生的收敛的测试损失表现出了较小的差异。

神经网络螺旋

此数据集是一种混乱的螺旋。显然，线性模型不适用于此处，但即使手动定义的特征组合可能也很难构建。

任务 1：只使用 X₁ 和 X₂ 训练您可以获得的最佳模型。您可以随时添加或移除层和神经元，以及更改学习速率、正则化率和批量大小等学习设置。您可以获得的最佳测试损失是多少？此模型输出表面的平滑程度如何？

任务 2：即使使用神经网络，通常也需要一些特征工程，才能获得最佳性能。尝试添加额外向量积特征或 sin(X₁) 和 sin(X₂) 等其他转换。您是否获得了更好的模型？模型输出表面是否更平滑？

（答案位于练习下方。）

点击下拉箭头即可查看可选答案。

以下视频详细介绍了如何在 Playground 中选择超参数，以针对可最大限度地减少测试损失的螺旋数据训练模型。

神经网络Playground 练习

首个神经网络

点击下拉箭头即可查看任务 1 的答案。

点击下拉箭头即可查看任务 2 的答案。

点击下拉箭头即可查看任务 3 的答案。

神经网络初始化

点击下拉箭头即可查看任务 1 的答案。

点击下拉箭头即可查看任务 2 的答案。

神经网络螺旋

点击下拉箭头即可查看可选答案。

神经网络螺旋解决方案