1 xjtu001 OP 第一次用 github 上传东西,不知道能不能打开哦 |
2 xjtu001 OP v2ex 竟然不能发图,有点懵,没法上传效果图 |
3 ivechan 2019-05-06 21:01:55 +08:00 ![]() ANN 和 DNN 这个概念先纠正一下。 ANN 应该是 artificial neural network,是比较广泛的概念,包含了 DNN。 DNN 是 deep neural network,有时候也称为 MLP,一般与 CNN, RNN 做区分。 你这里应该是三层网络( DNN )和单层网络(你说的 ANN )对比, 建议你把 DNN 中的 dropout 和 BatchNorm 先去掉,特别是 dropout ( 0.5 )可能太激进了。 另外注意下 Loss 曲线,三层比一层差可能有两个原因: 1. 过拟合,少训练一点时间就可以解决 2. 未拟合,建议增加时间,或者增加数据集。 |
4 xychang 2019-05-06 21:08:32 +08:00 via Android 你数据量多大啊?最后模型取的是第几个 epoch 的结果? |
![]() | 6 ipwx 2019-05-06 21:46:26 +08:00 无脑上 BN 和 Dropout 的都是猛士。 |
![]() | 9 loryyang 2019-05-06 21:50:31 +08:00 你的好和差到底是多少?至少要看到你的模型是欠拟合还是过拟合了,还是压根没有 work,然后相应地做调整 |
![]() | 11 longbye0 2019-05-06 22:41:17 +08:00 只看了下你写的 mlp。 同#3,去掉 bn 和 dropout。 看你输入输出应该是 721 维向量,自己度量下输入向量的相关性,判断下隐藏层该取小于 721 还是大于。 取一个完整工况不做训练,来验证。 |
12 usingnamespace 2019-05-07 01:52:38 +08:00 via iPhone 还好有人纠正了你的概念。。。 |
![]() | 13 jackOne 2019-05-07 09:15:07 +08:00 建议看下你模型训练过程中的训练损失曲线以及验证损失曲线,看模型是否 work 或者是过拟合 |