Python机器学习应用之基于BP神经网络的预测篇详解

2024-04-02 19:04:59 383人浏览安东尼

Python 官方文档：入门教程 => 点击学习

摘要

目录一、Introduction1 BP神经网络的优点2 BP神经网络的缺点二、实现过程1 Demo2 基于BP神经网络的乳腺癌分类预测三、Keys一、Introduction 1

一、Introduction

1 BP神经网络的优点

非线性映射能力：BP神经网络实质上实现了一个从输入到输出的映射功能，数学理论证明三层的神经网络就能够以任意精度逼近任何非线性连续函数。这使得其特别适合于求解内部机制复杂的问题，即BP神经网络具有较强的非线性映射能力。
自学习和自适应能力：BP神经网络在训练时，能够通过学习自动提取输入、输出数据间的“合理规则”，并自适应地将学习内容记忆于网络的权值中。即BP神经网络具有高度自学习和自适应的能力。
泛化能力：所谓泛化能力是指在设计模式分类器时，即要考虑网络在保证对所需分类对象进行正确分类，还要关心网络在经过训练后，能否对未见过的模式或有噪声污染的模式，进行正确的分类。也即BP神经网络具有将学习成果应用于新知识的能力。

2 BP神经网络的缺点

局部极小化问题：从数学角度看，传统的 BP神经网络为一种局部搜索的优化方法，它要解决的是一个复杂非线性化问题，网络的权值是通过沿局部改善的方向逐渐进行调整的，这样会使算法陷入局部极值，权值收敛到局部极小点，从而导致网络训练失败。加上BP神经网络对初始网络权重非常敏感，以不同的权重初始化网络，其往往会收敛于不同的局部极小，这也是每次训练得到不同结果的根本原因
BP 神经网络算法的收敛速度慢：由于BP神经网络算法本质上为梯度下降法，它所要优化的目标函数是非常复杂的，因此，必然会出现“锯齿形现象”，这使得BP算法低效；又由于优化的目标函数很复杂，它必然会在神经元输出接近0或1的情况下，出现一些平坦区，在这些区域内，权值误差改变很小，使训练过程几乎停顿；BP神经网络模型中，为了使网络执行BP算法，不能使用传统的一维搜索法求每次迭代的步长，而必须把步长的更新规则预先赋予网络，这种方法也会引起算法低效。以上种种，导致了BP神经网络算法收敛速度慢的现象。
BP 神经网络结构选择不一：BP神经网络结构的选择至今尚无一种统一而完整的理论指导，一般只能由经验选定。网络结构选择过大，训练中效率不高，可能出现过拟合现象，造成网络性能低，容错性下降，若选择过小，则又会造成网络可能不收敛。而网络的结构直接影响网络的逼近能力及推广性质。因此，应用中如何选择合适的网络结构是一个重要的问题。

二、实现过程

1 Demo


#%% 基础数组运算库导入
import numpy as np 
# 画图库导入
import matplotlib.pyplot as plt 
# 导入三维显示工具
from mpl_toolkits.mplot3D import Axes3D
# 导入BP模型
from sklearn.neural_network import MLPClassifier
# 导入demo数据制作方法
from sklearn.datasets import make_classification
from sklearn.metrics import classification_report, confusion_matrix
import seaborn as sns
import warnings
from sklearn.exceptions import ConvergenceWarning

#%%模型训练
# 制作五个类别的数据，每个类别1000个样本
train_samples, train_labels = make_classification(n_samples=1000, n_features=3, 
                           n_redundant=0,n_classes=5, n_infORMative=3, 
                           n_clusters_per_class=1,class_sep=3, random_state=10)
# 将五个类别的数据进行三维显示
fig = plt.figure()
ax = Axes3D(fig, rect=[0, 0, 1, 1], elev=20, azim=20)
ax.scatter(train_samples[:, 0], train_samples[:, 1], train_samples[:, 2], marker='o', c=train_labels)
plt.title('Demo Data Map')


#%% 建立 BP 模型, 采用sgd优化器，relu非线性映射函数
BP = MLPClassifier(solver='sgd',activation = 'relu',max_iter = 500,alpha = 1e-3,
                   hidden_layer_sizes = (32,32),random_state = 1)
# 进行模型训练
with warnings.catch_warnings():
    warnings.filterwarnings("ignore", cateGory=ConvergenceWarning,
                            module="sklearn")
    BP.fit(train_samples, train_labels)
# 查看 BP 模型的参数
print(BP)
#%% 进行模型预测
predict_labels = BP.predict(train_samples)
# 显示预测的散点图
fig = plt.figure()
ax = Axes3D(fig, rect=[0, 0, 1, 1], elev=20, azim=20)
ax.scatter(train_samples[:, 0], train_samples[:, 1], train_samples[:, 2], marker='o', c=predict_labels)
plt.title('Demo Data Predict Map with BP Model')

# 显示预测分数
print("预测准确率: {:.4f}".format(BP.score(train_samples, train_labels)))

# 可视化预测数据 
print("真实类别：", train_labels[:10])
print("预测类别：", predict_labels[:10])
# 准确率等报表
print(classification_report(train_labels, predict_labels))

# 计算混淆矩阵
classes = [0, 1, 2, 3]
cofusion_mat = confusion_matrix(train_labels, predict_labels, classes) 
sns.set()
figur, ax = plt.subplots()
# 画热力图
sns.heatmap(cofusion_mat, cmap="YlGnBu_r", annot=True, ax=ax) 
ax.set_title('confusion matrix')  # 标题
ax.set_xticklabels([''] + classes, minor=True)
ax.set_yticklabels([''] + classes, minor=True)
ax.set_xlabel('predict')  # x轴
ax.set_ylabel('true')  # y轴
plt.show()


#%%# 进行新的测试数据测试
test_sample = np.array([[-1, 0.1, 0.1]])
print(f"{test_sample} 类别是: ", BP.predict(test_sample))
print(f"{test_sample} 类别概率分别是: ", BP.predict_proba(test_sample))

test_sample = np.array([[-1.2, 10, -91]])
print(f"{test_sample} 类别是: ", BP.predict(test_sample))
print(f"{test_sample} 类别概率分别是: ", BP.predict_proba(test_sample))

test_sample = np.array([[-12, -0.1, -0.1]])
print(f"{test_sample} 类别是: ", BP.predict(test_sample))
print(f"{test_sample} 类别概率分别是: ", BP.predict_proba(test_sample))

test_sample = np.array([[100, -90.1, -9.1]])
print(f"{test_sample} 类别是: ", BP.predict(test_sample))
print(f"{test_sample} 类别概率分别是: ", BP.predict_proba(test_sample))

2 基于BP神经网络的乳腺癌分类预测


#%%基于BP神经网络的乳腺癌分类
#基本库导入
# 导入乳腺癌数据集
from sklearn.datasets import load_breast_cancer
# 导入BP模型
from sklearn.neural_network import MLPClassifier
# 导入训练集分割方法
from sklearn.model_selection import train_test_split 
# 导入预测指标计算函数和混淆矩阵计算函数
from sklearn.metrics import classification_report, confusion_matrix
# 导入绘图包
import seaborn as sns
import matplotlib.pyplot as plt
# 导入三维显示工具
from mpl_toolkits.mplot3d import Axes3D
# 导入乳腺癌数据集
cancer = load_breast_cancer()
# 查看数据集信息
print('breast_cancer数据集的长度为：',len(cancer))
print('breast_cancer数据集的类型为：',type(cancer))
# 分割数据为训练集和测试集
cancer_data = cancer['data']
print('cancer_data数据维度为：',cancer_data.shape)
cancer_target = cancer['target']
print('cancer_target标签维度为：',cancer_target.shape)
cancer_names = cancer['feature_names']
cancer_desc = cancer['DESCR']
#分为训练集与测试集
cancer_data_train,cancer_data_test = train_test_split(cancer_data,test_size=0.2,random_state=42)#训练集
cancer_target_train,cancer_target_test = train_test_split(cancer_target,test_size=0.2,random_state=42)#测试集


#%%# 建立 BP 模型, 采用Adam优化器，relu非线性映射函数
BP = MLPClassifier(solver='adam',activation = 'relu',max_iter = 1000,alpha = 1e-3,hidden_layer_sizes = (64,32, 32),random_state = 1)
# 进行模型训练
BP.fit(cancer_data_train, cancer_target_train)
#%% 进行模型预测
predict_train_labels = BP.predict(cancer_data_train)
# 可视化真实数据
fig = plt.figure()
ax = Axes3D(fig, rect=[0, 0, 1, 1], elev=20, azim=20) 
ax.scatter(cancer_data_train[:, 0], cancer_data_train[:, 1], cancer_data_train[:, 2], marker='o', c=cancer_target_train)
plt.title('True Label Map')
plt.show()
# 可视化预测数据
fig = plt.figure()
ax = Axes3D(fig, rect=[0, 0, 1, 1], elev=20, azim=20) 
ax.scatter(cancer_data_train[:, 0], cancer_data_train[:, 1], cancer_data_train[:, 2], marker='o', c=predict_train_labels)
plt.title('Cancer with BP Model')
plt.show()


#%% 显示预测分数
print("预测准确率: {:.4f}".format(BP.score(cancer_data_test, cancer_target_test)))
# 进行测试集数据的类别预测
predict_test_labels = BP.predict(cancer_data_test)
print("测试集的真实标签:\n", cancer_target_test)
print("测试集的预测标签:\n", predict_test_labels)
#%% 进行预测结果指标统计 统计每一类别的预测准确率、召回率、F1分数
print(classification_report(cancer_target_test, predict_test_labels))


#%% 计算混淆矩阵
confusion_mat = confusion_matrix(cancer_target_test, predict_test_labels)
# 打印混淆矩阵
print(confusion_mat)
# 将混淆矩阵以热力图的方式显示
sns.set()
figure, ax = plt.subplots()
# 画热力图
sns.heatmap(confusion_mat, cmap="YlGnBu_r", annot=True, ax=ax)  
# 标题 
ax.set_title('confusion matrix')
# x轴为预测类别
ax.set_xlabel('predict')  
# y轴实际类别
ax.set_ylabel('true')  
plt.show()

注：之前还做过基于BP神经网络的人口普查数据预测，有需要的猿友私信

三、Keys

BP神经网络的要点在于前向传播和误差反向传播，来对参数进行更新，使得损失最小化。

它是一个迭代算法，基本思想是：

先计算每一层的状态和激活值，直到最后一层（即信号是前向传播的）；
计算每一层的误差，误差的计算过程是从最后一层向前推进的（反向传播）；
更新参数（目标是误差变小）。迭代前面两个步骤，直到满足停止准则（比如相邻两次迭代的误差的差别很小）。

886~~~

到此这篇关于python机器学习应用之基于BP神经网络的预测篇详解的文章就介绍到这了,更多相关Python BP神经网络内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Python机器学习应用之基于BP神经网络的预测篇详解

本文链接: https://www.lsjlt.com/news/162773.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Python机器学习应用之基于BP神经网络的预测篇详解

目录一、Introduction1 BP神经网络的优点2 BP神经网络的缺点二、实现过程1 Demo2 基于BP神经网络的乳腺癌分类预测三、Keys一、Introduction 1 ...

99+

2024-04-02
Python中如何进行基于BP神经网络的预测

今天就跟大家聊聊有关Python中如何进行基于BP神经网络的预测，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。一、Introduction1 BP神经网络的优点非线性映射能力：BP神...

99+

2023-06-26
Python机器学习应用之基于LightGBM的分类预测篇解读

目录一、Introduction1 LightGBM的优点2 LightGBM的缺点二、实现过程1 数据集介绍2 Coding三、KeysLightGBM的重要参数基本参数调整针对训...

99+

2024-04-02
python机器学习之神经网络

手写数字识别算法 import pandas as pd import numpy as np from sklearn.neural_network import MLPReg...

99+

2024-04-02
机器学习：基于神经网络对用户评论情感分析预测

机器学习：基于神经网络对用户评论情感分析预测作者：i阿极作者简介：Python领域新星作者、多项比赛获奖者：博主个人首页 😊😊😊如果觉得文章不错或能帮助到你学习，可以点赞👍收藏📁评论📒+关...

99+

2023-09-10

机器学习神经网络 python 深度学习
Python机器学习应用之基于决策树算法的分类预测篇

目录一、决策树的特点 1.优点 2.缺点二、决策树的适用场景三、demo一、决策树的特点 1.优点具有很好的解释性，模型可以生成可以理解的规则。可以发现特征的重要程度。模型...

99+

2024-04-02
Python深度学习pytorch神经网络Dropout应用详解解

目录扰动的鲁棒性实践中的dropout简洁实现扰动的鲁棒性在之前我们讨论权重衰减（L2正则化）时看到的那样，参数的范数也代表了一种有用的简单性度量。简单性的另一个有用...

99+

2024-04-02
python机器学习之神经网络的示例分析

这篇文章主要介绍了python机器学习之神经网络的示例分析，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。python可以做什么Python是一种编程语言，内置了许多有效的工具...

99+

2023-06-14
Python机器学习应用之支持向量机的分类预测篇

目录1、Question2、Answer！——SVM3、软间隔4、超平面支持向量机常用于数据分类，也可以用于数据的回归预测 1、Question 我们经常会遇...

99+

2024-04-02
python机器学习实现神经网络示例解析

目录单神经元引论参考多神经元单神经元引论对于如花，大美，小明三个因素是如何影响小强这个因素的。这里用到的是多元的线性回归，比较基础 from numpy import a...

99+

2024-04-02
python神经网络学习数据增强及预处理示例详解

目录学习前言处理长宽不同的图片数据增强1、在数据集内进行数据增强2、在读取图片的时候数据增强3、目标检测中的数据增强学习前言进行训练的话，如果直接用原图进行训练，也是可以的（就如我...

99+

2024-04-02
Python机器学习应用之基于线性判别模型的分类篇详解

目录一、Introduction1 LDA的优点2 LDA的缺点3 LDA在模式识别领域与自然语言处理领域的区别二、Demo三、基于LDA 手写数字的分类四、小结一、Introduc...

99+

2024-04-02
python机器学习GCN图卷积神经网络原理解析

目录1. 图信号处理知识1.1 图的拉普拉斯矩阵1.1.1 拉普拉斯矩阵的定义及示例1.1.2 正则化拉普拉斯矩阵1.2 图上的傅里叶变换1.3 图信号滤波器2. 图卷积神经网络2....

99+

2024-04-02
Python机器学习应用之基于天气数据集的XGBoost分类篇解读

目录一、XGBoost1 XGBoost的优点2 XGBoost的缺点二、实现过程1 数据集2 实现三、KeysXGBoost的重要参数一、XGBoost XGBoost并不是一种模...

99+

2024-04-02
机器学习之支持向量回归（SVR）预测房价—基于python

大家好，我是带我去滑雪！本期使用爬取到的有关房价数据集data.csv，使用支持向量回归（SVR）方法预测房价。该数据集中“y1”为响应变量，为房屋总价，而x1-x9为特征变量，依次表示房屋的卧室数量、客厅数量、面...

99+

2023-09-15

python 机器学习支持向量机
python机器学习GCN图卷积神经网络的原理是什么

这篇文章主要介绍“python机器学习GCN图卷积神经网络的原理是什么”，在日常操作中，相信很多人在python机器学习GCN图卷积神经网络的原理是什么问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”pytho...

99+

2023-06-30
Python机器学习应用之工业蒸汽数据分析篇详解

目录一、数据集二、数据分析1 数据导入2 数据特征探索（数据可视化）三、特征优化四、对特征构造后的训练集和测试集进行主成分分析五、使用ＬｉｇｈｔＧＢＭ模型进行训练和预测一、数据集 1...

99+

2024-04-02
Python使用机器学习模型实现温度预测详解

目录温度预测回归分析温度预测随机森林 Python 写法使用 Python 可以使用机器学习模型进行温度预测。常用的模型有回归分析、随机森林等。使用前需要准备足够的历史数据并进行...

99+

2023-01-31

Python机器学习温度预测 Python温度预测 Python 预测
Python机器学习应用之决策树分类实例详解

目录一、数据集二、实现过程1 数据特征分析2 利用决策树模型在二分类上进行训练和预测3 利用决策树模型在多分类（三分类）上进行训练与预测三、KEYS1 构建过程2 划分选择3 重要参...

99+

2024-04-02