首页 > 资讯 > 后端开发 > Python >AI:如何训练机器学习的模型

213

分享到

AI:如何训练机器学习的模型

2024-04-02 19:04:59 213人浏览八月长安

Python 官方文档：入门教程 => 点击学习

摘要

目录1.Training: 如何训练模型2. Loss Function:损失和损失函数3. Gradient Descent:梯度下降法4. Learning Rate:学习速率5

1.Training: 如何训练模型

一句话理解机器学习一般训练过程：通过有标签样本来调整（学习）并确定所有权重Weights和偏差Bias的理想值。

训练的目标：最小化损失函数

（损失函数下面马上会介绍）

机器学习算法在训练过程中，做的就是：检查多个样本并尝试找出可最大限度地减少损失的模型；目标就是将损失(Loss)最小化

在这里插入图片描述

上图就是一般模型训练的一般过程（试错过程），其中

模型：将一个或多个特征作为输入，然后返回一个预测 (y') 作为输出。为了进行简化，不妨考虑一种采用一个特征并返回一个预测的模型，如下公式（其中b为 bias，w为weight）

在这里插入图片描述

计算损失：通过损失函数，计算该次参数（bias、weight）下的loss。
计算参数更新：检测损失函数的值，并为参数如bias、weight生成新值，以降低损失为最小。

例如：使用梯度下降法，因为通过计算整个数据集中w每个可能值的损失函数来找到收敛点这种方法效率太低。所以通过梯度能找到损失更小的方向，并迭代。

举个Tensorflow代码栗子，对应上面公式在代码中定义该线性模型：


y_output = tf.multiply(w,x) + b

假设该模型应用于房价预测，那么y_output为预测的房价，x为输入的房子特征值（如房子位置、面积、楼层等）

2. Loss Function:损失和损失函数

损失是一个数值表示对于单个样本而言模型预测的准确程度。

如果模型的预测完全准确，则损失为零，否则损失会较大。

训练模型的目标是从所有样本中找到一组平均损失“较小”的权重和偏差。

损失函数的目标：准确找到预测值和真实值的差距

在这里插入图片描述

如图红色箭头表示损失，蓝线表示预测。明显左侧模型的损失较大；右侧模型的损失较小

要确定loss，模型必须定义损失函数 loss function。例如，线性回归模型通常将均方误差用作损失函数，而逻辑回归模型则使用对数损失函数。

正确的损失函数，可以起到让预测值一直逼近真实值的效果，当预测值和真实值相等时，loss值最小。

举个TensorFlow代码栗子，在代码中定义一个损失loss_price 表示房价预测时的loss，使用最小二乘法作为损失函数：


loss_price = tr.reduce_sum(tf.pow(y_real - y_output), 2)

这里，y_real是代表真实值，y_output代表模型输出值（既上文公式的y' ），因为有的时候这俩差值会是负数，所以会对误差开平方，具体可以搜索下最小二乘法公式

3. Gradient Descent:梯度下降法

理解梯度下降就好比在山顶以最快速度下山：

好比道士下山，如何在一座山顶上，找到最短的路径下山，并且确定最短路径的方向

原理上就是凸形问题求最优解，因为只有一个最低点；即只存在一个斜率正好为 0 的位置。这个最小值就是损失函数收敛之处。

在这里插入图片描述

通过计算整个数据集中每个可能值的损失函数来找到收敛点这种方法效率太低。我们来研究一种更好的机制，这种机制在机器学习领域非常热门，称为梯度下降法。

梯度下降法的目标：寻找梯度下降最快的那个方向

梯度下降法的第一个阶段是为选择一个起始值（起点）。起点并不重要；因此很多算法就直接将设为 0 或随机选择一个值。下图显示的是我们选择了一个稍大于 0 的起点：

在这里插入图片描述

然后，梯度下降法算法会计算损失曲线在起点处的梯度。简而言之，梯度是偏导数的矢量；它可以让您了解哪个方向距离目标“更近”或“更远”。请注意，损失相对于单个权重的梯度（如图所示）就等于导数。

请注意，梯度是一个矢量，因此具有以下两个特征：

方向
大小

梯度始终指向损失函数中增长最为迅猛的方向。梯度下降法算法会沿着负梯度的方向走一步，以便尽快降低损失

为了确定损失函数曲线上的下一个点，梯度下降法算法会将梯度大小的一部分与起点相加

在这里插入图片描述

然后，梯度下降法会重复此过程，逐渐接近最低点。（找到了方向）

随机梯度下降法SGD：解决数据过大，既一个Batch过大问题，每次迭代只是用一个样本（Batch为1），随机表示各个batch的一个样本都是随机选择。

4. Learning Rate:学习速率

好比上面下山问题中，每次下山的步长。

因为梯度矢量具有方向和大小，梯度下降法算法用梯度乘以一个称为学习速率（有时也称为步长）的标量，以确定下一个点的位置。这是超参数，用来调整AI算法速率

例如，如果梯度大小为 2.5，学习速率为 0.01，则梯度下降法算法会选择距离前一个点 0.025 的位置作为下一个点。

超参数是编程人员在机器学习算法中用于调整的旋钮。大多数机器学习编程人员会花费相当多的时间来调整学习速率。如果您选择的学习速率过小，就会花费太长的学习时间：

在这里插入图片描述

继续上面的栗子，实现梯度下降代码为：


train_step = tf.train.GradientDescentOptimizer(0.025).minimize(loss_price)

这里设置梯度下降学习率为0.025, GradientDescentOptimizer()就是使用的随机梯度下降算法，而loss_price是由上面的损失函数获得的loss

至此有了模型、损失函数以及梯度下降函数，就可以进行模型训练阶段了：


Session = tf.Session()
Session.run(init)
for _ in range(1000):
	Session.run(train_step, feed_dict={x:x_data, y:y_data})

这里可以通过for设置固定的training 次数，也可以设置条件为损失函数的值低于设定值，

x_data y_data则为训练所用真实数据，x y 是输入输出的placeholder（代码详情参见TensorFlow api文档）

5. 扩展：BP神经网络训练过程

BP（BackPropagation）网络的训练，是反向传播算法的过程，是由数据信息的正向传播和误差Error的反向传播两个过程组成。

反向传播算法是神经网络算法的核心，其数学原理是：链式求导法则

正向传播过程：

输入层通过接收输入数据，传递给中间层（各隐藏层）神经元，每一个神经元进行数据处理变换，然后通过最后一个隐藏层传递到输出层对外输出。

反向传播过程：

正向传播后通过真实值和输出值得到误差Error，当Error大于设定值，既实际输出与期望输出差别过大时，进入误差反向传播阶段：

Error通过输出层，按照误差梯度下降的方式，如上面提到的随机梯度下降法SGD，反向修正各层参数（如Weights），向隐藏层、输入层逐层反转。

通过不断的正向、反向传播，直到输出的误差减少到预定值，或到达最大训练次数。

在这里插入图片描述

到此这篇关于AI:如何训练机器学习的模型的文章就介绍到这了,相信对你有所帮助，更多相关机器学习内容请搜索编程网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持编程网！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: AI:如何训练机器学习的模型

本文链接: http://www.lsjlt.com/news/123704.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

AI:如何训练机器学习的模型

目录1.Training: 如何训练模型2. Loss Function:损失和损失函数3. Gradient Descent:梯度下降法4. Learning Rate:学习速率5...

99+

2024-04-02
AI怎么训练机器学习的模型

这篇文章将为大家详细讲解有关AI怎么训练机器学习的模型，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。1.Training: 如何训练模型一句话理解机器学习一般训练过程：通过有标签样本来调整（学习）并确定...

99+

2023-06-14
前端AI机器学习在浏览器中训练模型

目录识别鸢尾花测试集: testing.json训练集: training.json完整代码index.htmlindex.jsstyles.csspackage.json识别鸢尾花...

99+

2024-04-02
训练自己的ai模型（一）学习笔记与项目实操

ai模型大火，作为普通人，我也想做个自己的ai模型训练自己的ai模型通常需要接下来的的六步一、收集和准备数据集：需要收集和准备一个数据集，其中包含想要训练模型的数据。这可能需要一些数据清理和预处理，以确保数据集的质量和一致性。二、选择和设...

99+

2023-08-17

人工智能学习 python java
C++技术中的机器学习：使用C++训练机器学习模型的最佳实践

在 c++++ 中训练机器学习模型的最佳实践包括：使用高效的数据结构。优化内存管理。利用多线程。集成流行的机器学习库。关注代码简洁性。 C++ 技术中的机器学习：训练机器学习模型的最佳...

99+

2024-05-11

机器学习 c++
Golang技术在机器学习中加速模型训练的技术

通过利用 go 的高性能并发性，可加快机器学习模型训练：1. 并行数据加载，充分利用 goroutine 加载数据；2. 优化算法，通过通道机制分布计算；3. 分布式计算，使用原生网络支...

99+

2024-05-09

机器学习 golang
使用Java中的TensorFlow来构建和训练机器学习模型

如果您觉得本博客的内容对您有所帮助或启发，请关注我的博客，以便第一时间获取最新技术文章和教程。同时，也欢迎您在评论区留言，分享想法和建议。谢谢支持！一、引言 1.1 TensorFlow简介 TensorFlow是由Google B...

99+

2023-09-28

机器学习 java tensorflow
使用C++训练机器学习模型：从数据预处理到模型验证

在 c++++ 中训练 ml 模型涉及以下步骤：数据预处理：加载、转换并工程化数据。模型训练：选择算法并训练模型。模型验证：划分数据集，评估性能，并调整模型。通过遵循这些步骤，您可以成功...

99+

2024-05-11

机器学习 c++
怎么使用R语言进行机器学习模型训练和评估

在R语言中，可以使用各种机器学习库和包来进行模型训练和评估。以下是一个简单的步骤来使用R语言进行机器学习模型训练和评估的示例：准...

99+

2024-03-04

R语言
Python 机器学习模型评估：如何衡量机器学习模型的性能

模型评估概述机器学习模型评估是机器学习过程中关键的一步，用于衡量模型在给定数据集上的性能和泛化能力。评估结果可以帮助我们了解模型是否适合特定问题，并为模型选择和调优提供指导。评估指标准确度（Accuracy）准确度是最常用的评估...

99+

2024-02-14

机器学习模型评估准确度召回率精确率 F1 分数 ROC 曲线混淆矩阵
Pytorch如何保存训练好的模型

本篇内容介绍了“Pytorch如何保存训练好的模型”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！为什么要保存和加载模型用数据对模型进行训练后...

99+

2023-07-05
pytorch如何调用训练好的模型

要调用训练好的模型，首先需要加载模型的参数，并将其应用到一个 PyTorch 模型中。以下是一个简单的示例代码，展示如何加载模型参数...

99+

2024-04-02
模型训练：优化人工智能和机器学习，完善DevOps工具的使用

作者：JFrog大中华区总经理董任远据说法餐的秘诀在于黄油、黄油、更多的黄油。同样，对于DevOps而言，成功的三大秘诀是自动化、自动化、更高程度的自动化，而这一切归根结底都在于构建能够更快速地不断发布新版软件的流程。尽管人们认为在人...

99+

2023-09-05

人工智能机器学习 devops
PaddlePaddle如何使用预训练模型

PaddlePaddle提供了许多预训练模型，用户可以使用这些模型来进行迁移学习或者在自己的数据集上进行微调。下面是一个使用预训练模...

99+

2024-04-02
TensorFlow如何指定GPU训练模型

目录如何指定GPU训练模型举个例子如果要指定多块 GPU如何指定GPU训练模型 Linux 查看当前服务器 GPU 的占用情况可以使用 nvidia-smi 命令，如下所示： nvi...

99+

2024-04-02
python深度学习tensorflow训练好的模型进行图像分类

目录正文随机找一张图片读取图片进行分类识别最后输出正文谷歌在大型图像数据库ImageNet上训练好了一个Inception-v3模型，这个模型我们可以直接用来进来图像分类。下载链...

99+

2024-04-02
Python人工智能深度学习模型训练经验总结

目录一、假如训练集表现不好1.尝试新的激活函数2.自适应学习率①Adagrad②RMSProp③ Momentum④Adam二、在测试集上效果不好1.提前停止2.正则化3.Dropo...

99+

2024-04-02
PyTorch中如何使用预训练的模型

在PyTorch中使用预训练的模型可以通过torchvision库中的models模块实现。该模块包含了一些常用的预训练模型，如Re...

99+

2024-03-05

PyTorch
Keras中如何使用预训练模型

Keras中可以使用预训练模型来进行迁移学习或者微调。以下是使用预训练模型的一般步骤：导入所需的预训练模型，比如VGG16、Re...

99+

2024-04-02
Python人工智能深度学习模型训练经验有哪些

Python人工智能深度学习模型训练经验有哪些，相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。一、假如训练集表现不好1.尝试新的激活函数ReLU：Rectified Linear...

99+

2023-06-25