第2讲神经网络优化

🖼 人工智能学习总目录

🖼 视频资料都在这里—北京大学TensorFlow2.0公开课，建议看课，这里只是我写的可参考的在线笔记

🖼 主要学会用TensorFlow2搭建神经网络方法、离散数据的分类、连续数据的预测

本讲目标:学会神经网络优化过程，使用正则化减少过拟合，使用优化器更新网络参数。

1、神经网络复杂度

1.1 时间复杂度

即模型的运算次数，可用浮点运算次数(FPLOPs, FLoating-point OPerations)或者乘加运算次数衡量

1.2 空间复杂度

空间复杂度(访存量)，严格来讲包括两部分:总参数量 + 各层输出特征图。

参数量:模型所有带参数的层的权重参数总量;
特征图:模型在实时运行过程中每层所计算出的输出特征图大小。

2 学习率策略

2.1 指数衰减

学习率跟着学习的层数，指数衰减

import tensorflow as tf

w = tf.Variable(tf.constant(5, dtype=tf.float32))

epoch = 40
LR_BASE = 0.2  # 最初学习率
LR_DECAY = 0.99  # 学习率衰减率
LR_STEP = 1  # 喂入多少轮BATCH_SIZE后，更新一次学习率

for epoch in range(epoch):  # for epoch 定义顶层循环，表示对数据集循环epoch次，此例数据集数据仅有1个w,初始化时候constant赋值为5，循环100次迭代。
    lr = LR_BASE * LR_DECAY ** (epoch / LR_STEP)
    with tf.GradientTape() as tape:  # with结构到grads框起了梯度的计算过程。
        loss = tf.square(w + 1)
    grads = tape.gradient(loss, w)  # .gradient函数告知谁对谁求导

    w.assign_sub(lr * grads)  # .assign_sub 对变量做自减  即 w = w - lr*grads
    print("After %s epoch,w is %f,loss is %f,lr is %f" % (epoch, w.numpy(), loss, lr))