Tensorflow多元线性回归参数不收敛的问题

Question

Tensorflow多元线性回归参数不收敛的问题

发布于
2018-03-08

在使用Tensorflow进行多元线性回归的时候，遇到了参数不收敛的问题。问题在于优化方法的选择上：如果使用tf.train.AdamOptimizer(0.01).minimize(loss)进行，参数会收敛，损失函数也比较合理，但是权重和偏置项与原来的不一致，这是第一个不明白的地方；如果使用opt = tf.train.GradientDescentOptimizer(0.01).minimize(loss)，则损失函数会一直增大，找不到原因。如果初学者一直找不到原因，希望大家有明白的，可以帮忙解释一下，代码量并不大。下面是代码：

import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf

# 模拟输入数据，区间均匀分布
X1 = np.matrix(np.random.uniform(-10, 10, 100)).T
X2 = np.matrix(np.linspace(-10, 10, 100)).T
X3 = np.matrix(np.linspace(-10, 10, 100)).T
X_input = np.concatenate((X1, X2, X3), axis=1)
# 权重应该是 20,, -35, 4.3 偏置项是25
Y_input = 20 * X1 - 35 * X2 + 4.3 * X3 + 25 * np.ones((100, 1))

# 权重向量和偏置项
W = tf.Variable(tf.random_uniform(shape=[3, 1]))
b = tf.Variable(tf.random_uniform(shape=[1, 1]))

# 占位符
X = tf.placeholder(dtype=tf.float32, shape=[None, 3])
Y = tf.placeholder(dtype=tf.float32, shape=[None, 1])

# 预测值
Y_pred = tf.matmul(X, W) + b * np.ones((100, 1))

# 损失函数
loss = tf.reduce_sum(tf.square(Y_pred - Y)) / 100

# Adma算法优化，学习步长是0.01
opt = tf.train.AdamOptimizer(0.01).minimize(loss)
# 梯度下降
# opt = tf.train.GradientDescentOptimizer(0.01).minimize(loss)

# 用于绘图
x_axis = []
y_axis = []

with tf.Session() as sess:
    # 初始化变量
    sess.run(tf.global_variables_initializer())
    print("training,please wait...")
    for i in range(20000):
        sess.run(opt, feed_dict={Y: Y_input, X: X_input})
        x_axis.append(i)
        y_axis.append(sess.run(loss, feed_dict={Y: Y_input, X: X_input}))
    print("finish training!")
    print("W:", sess.run(W), "\nb:", sess.run(b))
    print(sess.run(loss, feed_dict={Y: Y_input, X: X_input}))
    plt.plot(x_axis, y_axis)
    plt.show()

tensorflow 线性回归机器学习

阅读 6.7k

1 个回答

得票最新

DerekGrant

1965

发布于
2018-03-30

✓ 已被采纳

这么点数据搞2万轮的话很容易overfitting
但这不是主要问题，主要是GD没有动量，容易陷入局部最优解；而adam自带动量，一般来说不容易陷入局部最优，性能会比较好。
至于你开始设的权重的话只是为了计算Y——input值，而神经网络是自己拟合权值的，完全无视你设的权值，所以不一样是正常的，一样才是吊鬼了。

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

python有什么小型项目用到机器学习，神经网络进行数据分析的？
我想找几个简单的看看学习学习。
1 回答3.2k 阅读

相似问题

找不到问题？创建新问题

Tensorflow多元线性回归参数不收敛的问题

你尚未登录，登录后可以

python有什么小型项目用到机器学习，神经网络进行数据分析的？