【TensorFlow】通过两个简单的例子实现反向传播,主播明星对抗赛_硬件技术

文件名：【TensorFlow】通过两个简单的例子实现反向传播,主播明星对抗赛【TensorFlow】通过两个简单的例子实现反向传播回归算法示例 # python 3.6# TensorFlow实现反向传播import tensorflow as tfimport numpy as npsess = tf.Session()# 一、回归算法# 从均值为1、标准差为0.1的正态分布中抽样随机数，# 然后乘以变量A，损失函数为L2正则损失函数。# 理论上，A的最优值是10，因为生成的样例数据均值是1。# 1.生成数据创建占位符和变量Ax_vals = np.random.normal(1,0.1,100)y_vals = np.repeat(10.,100)x_data = tf.placeholder(shape=[1],dtype=tf.float32)y_target = tf.placeholder(shape=[1],dtype=tf.float32)A = tf.Variable(tf.random_normal(shape=[1]))# 2.增加乘法操作my_output = tf.multiply(x_data,A)# 3.增加L2正则损失函数loss = tf.square(my_output-y_target)# 4.初始化所有变量init = tf.global_variables_initializer()sess.run(init)# 5.声明变量优化器# 迭代步长由学习率控制# 学习率越小收敛时间越长学习率过大可能无法收敛导致梯度消失或爆炸my_opt = tf.train.GradientDescentOptimizer(learning_rate=0.02)train_step = my_opt.minimize(loss)# 6.训练算法迭代100次每25次返回结果选择一个随机的x和y传入计算图# tf自动计算损失调整A偏差来最小化损失for i in range(100):rand_index = np.random.choice(100)rand_x = [x_vals[rand_index]]rand_y = [y_vals[rand_index]]sess.run(train_step,feed_dict={x_data:rand_x,y_target:rand_y})if (i+1)%25 == 0:print("Step # " + str(i+1) + ' A = ' + str(sess.run(A)))print("Loss=" + str(sess.run(loss,feed_dict={x_data:rand_x,y_target:rand_y}))) 分类算法示例 # python 3.6import tensorflow as tfimport numpy as np# 二、二值分类算法# 从两个正态分布N(-1,1)和N(3,1)生成100个数。# 所有从正态分布N(-1,1)生成的数据标为目标类0；# 从正态分布N(3,1)生成的数据标为目标类1，# 模型算法通过sigmoid函数将这些生成的数据转换成目标类数据。# 换句话讲，模型算法是sigmoid(x+A)# 其中，A是要拟合的变量，理论上A=-1。# 假设，两个正态分布的均值分别是m1和m2，则达到A的取值时，# 它们通过-(m1+m2)/2转换成到0等距的值。# 后面将会在TensorFlow中见证怎样取到相应的值。# 1.创建计算图sess = tf.Session()# 2.生成数据和目标标签、占位符和变量Ax_vals = np.concatenate((np.random.normal(-1,1,50),np.random.normal(3,1,50)))y_vals = np.concatenate((np.repeat(0.,50),np.repeat(1.,50)))x_data = tf.placeholder(shape=[1],dtype=tf.float32)y_target = tf.placeholder(shape=[1],dtype=tf.float32)# 初始化变量A为10附近的值，远离理论值-1。# 这样可以清楚地显示算法是如何从10收敛为-1的。A = tf.Variable(tf.random_normal(mean=10,shape=[1]))# 3.增加转换操作my_output = tf.add(x_data,A)# 4.由于指定的损失函数期望批量数据增加一个批量数的维度，# 这里使用expand_dims()函数增加维度。# 之后将讨论如何使用批量变量训练，这次还是一次使用一个随机数据：my_output_expanded = tf.expand_dims(my_output,0)y_target_expanded = tf.expand_dims(y_target,0)# 5.初始化变量Ainit = tf.global_variables_initializer()sess.run(init)# 6.声明损失函数：带非归一化logits的交叉熵损失函数用sigmoid转换xentropy = tf.nn.sigmoid_cross_entropy_with_logits(logits=my_output_expanded,labels=y_target_expanded)# 7.增加一个优化器函数让TensorFlow知道如何更新和偏差变量my_opt = tf.train.GradientDescentOptimizer(0.05)train_step = my_opt.minimize(xentropy)# 8.通过随机选择的数据迭代几百次更新变量A 每200次输出loss和A的值for i in range(1400):rand_index=np.random.choice(100)rand_x = [x_vals[rand_index]]rand_y = [y_vals[rand_index]]sess.run(train_step, feed_dict={x_data:rand_x,y_target:rand_y})if (i+1)%200 == 0:print('Step # ' + str(i+1) + ' A = ' + str(sess.run(A)))print('Loss = '+ str(sess.run(xentropy,feed_dict={x_data:rand_x,y_target:rand_y}))) 总结

实现反向传播的步骤

生成数据；初始化占位符和变量；创建损失函数；定义一个优化器算法；通过随机数据样本进行迭代，更新变量。

学习率和优化器算法

学习率优点缺点使用场景大结果精确收敛慢算法不稳定，降低学习率小收敛快结果不精确算法收敛慢，提高学习率

问题有时，标准梯度下降算法会明显卡顿或者收敛变慢，特别是在梯度为0的附近的点。

解决思路 ①TensorFlow的MomentumOptimizer()函数增加了一项势能，前一次迭代过程的梯度下降值的倒数。

②可以改变的是优化器的步长，理想情况下，对于变化小的变量使用大步长；而变化迅速的变量使用小步长。实现这种优点的常用Adagrad算法。此算法考虑整个历史迭代的变量梯度，TensorFlow中相应功能的实现是AdagradOptimizer()函数。

问题有时，由于Adagrad算法计算整个历史迭代的梯度，导致梯度迅速变为0。

解决思路可以用Adadelta算法解决，它限制使用的迭代次数。TensorFlow中相应功能的实现是AdadeltaOptimizer()函数。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

【TensorFlow】通过两个简单的例子实现反向传播,主播明星对抗赛

2018年一季度乌克兰进口阿塞拜疆石油1.07亿美元

【TensorFlow】随机训练和批训练的比较与实现,170平台

【PTA-C语言】实验四-循环结构II,htc omega

【Qt】报错error-undefined reference to `vtable for Consumer‘的解决方法,PSP MEDIA PLAYER

【Qt】文件系统,kf755（qt文件管理系统）

【Qt图书管理系统】4.系统设计与详细设计,pop.pcpop.com（基于qt的图书管理系统）

【RT-DETR改进】SIoU、GIoU、CIoU、DIoU、AlphaIoU等二十余种损失函数,hp 2133

【RabbitMQ】之消息的可靠性方案,天逸f40（天逸f41测评）

【Redis】剖析RDB和AOF持久化原理,东芝液晶电视怎么样（东芝电视 arc）

【RocketMQ每日一问】rocketmq的各个版本特性？,华为g305t（rocketmq 5.0）

【Rust】文件系统,最新dx9.0c（rust文件操作）