TensorFlow 初学者,请教下

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

已注册用户请登录

这是一个创建于 2764 天前的主题，其中的信息可能已经有所发展或是发生改变。

代码如下:

#encoding: utf-8 import tensorflow as tf from numpy.random import RandomState # 获取一层神经网络边上的权重，并将这个权重的 L2 正则化损失加入名称为'losses'的集合中 def get_weight(shape, lambdaF): var = tf.Variable(tf.random_normal(shape)) # add_to_collection 函数将这个新生成变量的 L2 正则化损失加入集合。 # 这个函数的第一个参数'losses'， 是集合的名字，第二个参数是要加入这个集合的内容 tf.add_to_collection('losses', tf.contrib.layers.l2_regularizer(lambdaF)(var)) return var x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input') y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input') batch_size = 8 # 定义了每一层网络中节点的个数 layer_dimension = [2, 10, 10, 10, 1] # 神经网络的层数。 n_layers = len(layer_dimension) # 这个变量维护前向传播时最深层的节点，开始的时候就是输入层。 cur_layer = x # 当前层的节点个数 in_dimension = layer_dimension[0] # 通过一个循环来生成 5 层全连接的神经网络结构 for i in range(1, n_layers): # layer_dimension[i]为下一层的节点个数。 out_dimension = layer_dimension[i] # 生成当前层中权重的变量，并将这个变量的 L2 正则化损失加入计算图上的集合。 weight = get_weight([in_dimension, out_dimension], 0.001) bias = tf.Variable(tf.constant(0.1, shape=[out_dimension])) # 使用 ReLU 激活函数 cur_layer = tf.nn.relu(tf.matmul(cur_layer, weight) + bias) # 进入下一层之前将下一层的节点数更新为当前层节点个数 in_dimension = layer_dimension[i] # 在定义神经网络前向传播的同时已经将所有的 L2 正则化损失加入图上的集合， # 这里只需要计算刻画模型在训练数据上表现的损失函数 mse_loss = tf.reduce_mean(tf.square(y_ - cur_layer)) # 将均方误差损失函数加入损失集合 tf.add_to_collection('losses', mse_loss) # get_collection 返回一个列表， 这个列表是所有这个集合的元素。在这个样例中， # 这些元素就是损失函数的不同部分，将它们加起来就可以得到最终的损失函数 loss = tf.add_n(tf.get_collection('losses')) tran = tf.train.AdamOptimizer().minimize(loss) rdm = RandomState(1) dataset_size = 12800 X = rdm.rand(dataset_size, 2) Y = [ (x1*x2 + rdm.rand()/10.0 - 0.05,) for (x1, x2) in X] with tf.Session() as sess: sess.run(tf.global_variables_initializer()) STEPS = 1500000 for i in range(STEPS): start = (i * batch_size) % dataset_size end = min(dataset_size, start+batch_size) sess.run(tran, feed_dict={x:X[start:end], y_:Y[start:end]}) if i % 200 == 0: print(sess.run(loss, feed_dict={x:X, y_:Y}))

主要疑问是:

X = rdm.rand(dataset_size, 2) Y = [ (x1*x2 + rdm.rand()/10.0 - 0.05,) for (x1, x2) in X]

为什么,那些权重参数,能拟合出 X 和 Y 的映射关系,Y 是等于 x1*x2,这一点也不线性啊
运行了下,loss 可以小到 0.0035882844

第 1 条附言 2018-05-19 23:48:18 +08:00

嗯,标题,改成, <<机器学习初学者,请教下吧>>

第 2 条附言 2018-05-20 12:08:59 +08:00

我可能,会先跟着书本,拿几个 demo 练练手,后续,看情况再去深入理解各种基础概念吧

什么都从基础概念学起,可能导致,没那么有趣, 自顶而下,比较有趣

第 3 条附言 2018-05-20 12:13:24 +08:00

谢谢大家

函数

losses'

RDM

shape

13 条回复 2018-05-21 11:14:42 +08:00

yu099

2018-05-19 22:55:43 +08:00 via Android

你不懂的是机器学习还是 tensorflow ？

WildCat

2018-05-19 23:10:17 +08:00

@yu099 你不懂的是机器学习还是 TensorFlow ？+1

建议从基础学起吧，这些框架都是表象。

nine99

2018-05-19 23:14:26 +08:00

+1 看下理论基础吧

Hsinyao

2018-05-19 23:40:55 +08:00 via iPhone

我也是机器学习入门选手。你的问题应该算机器学习的基础知识了，权重参数 w 最开始还没训练的时候可以认为是乱给的，经过一次前向传播后得出 y 的预测值，然后再把预测值和正确答案对比，得到损失函数，然后在反向传播里用各种优化方法优化 w 参数，让损失降低，接着用优化过的 w 参数再进行下一次学习，这样重复成千上万轮的学习，w 最后就能很好的拟合 x 和 y 的关系。