首页 > 资讯 > 后端开发 > Python >PyTorch实现联邦学习的基本算法FedAvg

180

分享到

PyTorch实现联邦学习的基本算法FedAvg

2024-04-02 19:04:59 180人浏览八月长安

Python 官方文档：入门教程 => 点击学习

摘要

目录I. 前言II. 数据介绍特征构造III. 联邦学习1. 整体框架2. 服务器端3. 客户端IV. 代码实现1. 初始化2. 服务器端3. 客户端4. 测试V. 实验及结果VI.

I. 前言

在之前的一篇博客联邦学习基本算法FedAvg的代码实现中利用numpy手搭神经网络实现了FedAvg，手搭的神经网络效果已经很好了，不过这还是属于自己造轮子，建议优先使用PyTorch来实现。

II. 数据介绍

联邦学习中存在多个客户端，每个客户端都有自己的数据集，这个数据集他们是不愿意共享的。

本文选用的数据集为中国北方某城市十个区/县从2016年到2019年三年的真实用电负荷数据，采集时间间隔为1小时，即每一天都有24个负荷值。

我们假设这10个地区的电力部门不愿意共享自己的数据，但是他们又想得到一个由所有数据统一训练得到的全局模型。

除了电力负荷数据以外，还有一个备选数据集：风功率数据集。两个数据集通过参数type指定：type == 'load’表示负荷数据，'wind’表示风功率数据。

特征构造

用某一时刻前24个时刻的负荷值以及该时刻的相关气象数据（如温度、湿度、压强等）来预测该时刻的负荷值。

对于风功率数据，同样使用某一时刻前24个时刻的风功率值以及该时刻的相关气象数据来预测该时刻的风功率值。

各个地区应该就如何制定特征集达成一致意见，本文使用的各个地区上的数据的特征是一致的，可以直接使用。

III. 联邦学习

1. 整体框架

原始论文中提出的FedAvg的框架为：

在这里插入图片描述

客户端模型采用PyTorch搭建：

class ANN(nn.Module):
    def __init__(self, input_dim, name, B, E, type, lr):
        super(ANN, self).__init__()
        self.name = name
        self.B = B
        self.E = E
        self.len = 0
        self.type = type
        self.lr = lr
        self.loss = 0
        self.fc1 = nn.Linear(input_dim, 20)
        self.relu = nn.ReLU()
        self.sigmoid = nn.Sigmoid()
        self.dropout = nn.Dropout()
        self.fc2 = nn.Linear(20, 20)
        self.fc3 = nn.Linear(20, 20)
        self.fc4 = nn.Linear(20, 1)
    def forward(self, data):
        x = self.fc1(data)
        x = self.sigmoid(x)
        x = self.fc2(x)
        x = self.sigmoid(x)
        x = self.fc3(x)
        x = self.sigmoid(x)
        x = self.fc4(x)
        x = self.sigmoid(x)
        return x

2. 服务器端

服务器端执行以下步骤：

简单来说，每一轮通信时都只是选择部分客户端，这些客户端利用本地的数据进行参数更新，然后将更新后的参数传给服务器，服务器汇总客户端更新后的参数形成最新的全局参数。下一轮通信时，服务器端将最新的参数分发给被选中的客户端，进行下一轮更新。

3. 客户端

客户端没什么可说的，就是利用本地数据对神经网络模型的参数进行更新。

IV. 代码实现

1. 初始化

class FedAvg:
    def __init__(self, options):
        self.C = options['C']
        self.E = options['E']
        self.B = options['B']
        self.K = options['K']
        self.r = options['r']
        self.input_dim = options['input_dim']
        self.type = options['type']
        self.lr = options['lr']
        self.clients = options['clients']
        self.nn = ANN(input_dim=self.input_dim, name='server', B=B, E=E, type=self.type, lr=self.lr).to(device)
        self.nns = []
        for i in range(K):
            temp = copy.deepcopy(self.nn)
            temp.name = self.clients[i]
            self.nns.append(temp)

参数：

K，客户端数量，本文为10个，也就是10个地区。
C：选择率，每一轮通信时都只是选择C * K个客户端。
E：客户端更新本地模型的参数时，在本地数据集上训练E轮。
B：客户端更新本地模型的参数时，本地数据集batch大小为B
r：服务器端和客户端一共进行r轮通信。
clients：客户端集合。
type：指定数据类型，负荷预测or风功率预测。
lr：学习率。
input_dim：数据输入维度。
nn：全局模型。
nns：客户端模型集合。

2. 服务器端

服务器端代码如下：

def server(self):
     for t in range(self.r):
          print('第', t + 1, '轮通信:')
          m = np.max([int(self.C * self.K), 1])
          # sampling
          index = random.sample(range(0, self.K), m)
          # dispatch
          self.dispatch(index)
          # local updating
          self.client_update(index)
          # aggregation
          self.aggregation(index)
     # return global model
     return self.nn

其中client_update(index)：

def client_update(self, index):  # update nn
     for k in index:
          self.nns[k] = train(self.nns[k])

aggregation(index):

def aggregation(self, index):
     s = 0
     for j in index:
          # nORMal
          s += self.nns[j].len
     params = {}
     with torch.no_grad():
          for k, v in self.nns[0].named_parameters():
               params[k] = copy.deepcopy(v)
               params[k].zero_()
     for j in index:
          with torch.no_grad():
               for k, v in self.nns[j].named_parameters():
                    params[k] += v * (self.nns[j].len / s)
     with torch.no_grad():
          for k, v in self.nn.named_parameters():
               v.copy_(params[k])

dispatch(index)：

def dispatch(self, index):
     params = {}
     with torch.no_grad():
          for k, v in self.nn.named_parameters():
               params[k] = copy.deepcopy(v)
     for j in index:
          with torch.no_grad():
               for k, v in self.nns[j].named_parameters():
                    v.copy_(params[k])

下面对重要代码进行分析：

客户端的选择

m = np.max([int(self.C * self.K), 1])
index = random.sample(range(0, self.K), m)

index中存储中m个0~10间的整数，表示被选中客户端的序号。

客户端的更新

for k in index:
    self.client_update(self.nns[k])

服务器端汇总客户端模型的参数

关于模型汇总方式，可以参考一下我的另一篇文章：对FedAvg中模型聚合过程的理解。

当然，这只是一种很简单的汇总方式，还有一些其他类型的汇总方式。

论文Electricity Consumer Characteristics Identification: A Federated Learning Approach中总结了三种汇总方式：

normal：原始论文中的方式，即根据样本数量来决定客户端参数在最终组合时所占比例。

LA：根据客户端模型的损失占所有客户端损失和的比重来决定最终组合时参数所占比例。

LS：根据损失与样本数量的乘积所占的比重来决定。将更新后的参数分发给被选中的客户端

def dispatch(self, index):
     params = {}
     with torch.no_grad():
          for k, v in self.nn.named_parameters():
               params[k] = copy.deepcopy(v)
     for j in index:
          with torch.no_grad():
               for k, v in self.nns[j].named_parameters():
                    v.copy_(params[k])

3. 客户端

客户端只需要利用本地数据来进行更新就行了：

def client_update(self, index):  # update nn
     for k in index:
          self.nns[k] = train(self.nns[k])

其中train():

def train(ann):
    ann.train()
    # print(p)
    if ann.type == 'load':
        Dtr, Dte = nn_seq(ann.name, ann.B, ann.type)
    else:
        Dtr, Dte = nn_seq_wind(ann.named, ann.B, ann.type)
    ann.len = len(Dtr)
    # print(len(Dtr))
    loss_function = nn.MSELoss().to(device)
    loss = 0
    optimizer = torch.optim.Adam(ann.parameters(), lr=ann.lr)
    for epoch in range(ann.E):
        cnt = 0
        for (seq, label) in Dtr:
            cnt += 1
            seq = seq.to(device)
            label = label.to(device)
            y_pred = ann(seq)
            loss = loss_function(y_pred, label)
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
        print('epoch', epoch, ':', loss.item())
    return ann

4. 测试

def global_test(self):
     model = self.nn
     model.eval()
     c = clients if self.type == 'load' else clients_wind
     for client in c:
          model.name = client
          test(model)

V. 实验及结果

本次实验的参数选择为：

K	C	E	B	r
10	0.5	50	50	5

if __name__ == '__main__':
    K, C, E, B, r = 10, 0.5, 50, 50, 5
    type = 'load'
    input_dim = 30 if type == 'load' else 28
    _client = clients if type == 'load' else clients_wind
    lr = 0.08
    options = {'K': K, 'C': C, 'E': E, 'B': B, 'r': r, 'type': type, 'clients': _client,
               'input_dim': input_dim, 'lr': lr}
    fedavg = FedAvg(options)
    fedavg.server()
    fedavg.global_test()

各个客户端单独训练（训练50轮，batch大小为50）后在本地的测试集上的表现为：

客户端编号	1	2	3	4	5	6	7	8	9	10
MAPE / %	5.33	4.11	3.03	4.20	3.02	2.70	2.94	2.99	2.30	4.10

可以看到，由于各个客户端的数据都十分充足，所以每个客户端自己训练的本地模型的预测精度已经很高了。

服务器与客户端通信5轮后，服务器上的全局模型在10个客户端测试集上的表现如下所示：

客户端编号	1	2	3	4	5	6	7	8	9	10
MAPE / %	6.84	4.54	3.56	5.11	3.75	4.47	4.30	3.90	3.15	4.58

可以看到，经过联邦学习框架得到全局模型在各个客户端上表现同样很好ÿ0c;这是因为十个地区上的数据分布类似。

给出numpy和PyTorch的对比：

客户端编号	1	2	3	4	5	6	7	8	9	10
本地	5.33	4.11	3.03	4.20	3.02	2.70	2.94	2.99	2.30	4.10
numpy	6.58	4.19	3.17	5.13	3.58	4.69	4.71	3.75	2.94	4.77
PyTorch	6.84	4.54	3.56	5.11	3.75	4.47	4.30	3.90	3.15	4.58

同样本地模型的效果是最好的，PyTorch搭建的网络和numpy搭建的网络效果差不多，但推荐使用PyTorch，不要造轮子。

VI. 源码及数据

我把数据和代码放在了GitHub上：源码及数据，原创不易，下载时请随手给个follow和star，感谢！

以上就是PyTorch实现联邦学习的基本算法FedAvg的详细内容，更多关于PyTorch实现FedAvg算法的资料请关注编程网其它相关文章！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: PyTorch实现联邦学习的基本算法FedAvg

本文链接: https://www.lsjlt.com/news/117904.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

PyTorch实现联邦学习的基本算法FedAvg

目录I. 前言II. 数据介绍特征构造III. 联邦学习1. 整体框架2. 服务器端3. 客户端IV. 代码实现1. 初始化2. 服务器端3. 客户端4. 测试V. 实验及结果VI....

99+

2022-11-11
联邦学习神经网络FedAvg算法实现

目录I. 前言II. 数据介绍1. 特征构造III. 联邦学习1. 整体框架2. 服务器端3. 客户端4. 代码实现4.1 初始化4.2 服务器端4.3 客户端4.4 测试IV. 实...

99+

2022-11-11
PyTorch实现FedProx联邦学习算法

目录I. 前言III. FedProx1. 模型定义2. 服务器端3. 客户端更新IV. 完整代码I. 前言 FedProx的原理请见：FedAvg联邦学习FedProx异质网络优化...

99+

2022-11-11
PyTorch怎么实现FedProx联邦学习算法

这篇文章主要介绍了PyTorch怎么实现FedProx联邦学习算法的相关知识，内容详细易懂，操作简单快捷，具有一定借鉴价值，相信大家阅读完这篇PyTorch怎么实现FedProx联邦学习算法文章都会有所收获，下面我们一起来看看吧。I. 前言...

99+

2023-06-30
PyTorch怎么实现基本算法FedAvg

本文小编为大家详细介绍“PyTorch怎么实现基本算法FedAvg”，内容详细，步骤清晰，细节处理妥当，希望这篇“PyTorch怎么实现基本算法FedAvg”文章能帮助大家解决疑惑，下面跟着小编的思路慢慢深入，一起来学习新知识吧。数据介绍联...

99+

2023-06-30
联邦学习算法介绍-FedAvg详细案例-Python代码获取

联邦学习算法介绍-FedAvg详细案例-Python代码获取一、联邦学习系统框架二、联邦平均算法（FedAvg）三、联邦随梯度下降算法 (FedSGD）四、差分隐私随联邦梯度下降算法 (DP...

99+

2023-08-31

python 算法机器学习
使用Pytorch实现强化学习——DQN算法

目录一、强化学习的主要构成二、基于python的强化学习框架三、gym 四、DQN算法 1.经验回放 2.目标网络五、使用pytorch实现DQN算法 1.replay memory 2.神经网络部分 3.Agent 4.模型训练...

99+

2023-09-24

python 开发语言
Python实现机器学习算法的分类

Python算法的分类对葡萄酒数据集进行测试，由于数据集是多分类且数据的样本分布不平衡，所以直接对数据测试，效果不理想。所以使用SMOTE过采样对数据进行处理，对数据去重，去空，处...

99+

2022-11-12
Python机器学习实战之k-近邻算法的实现

目录K-近邻算法概述工作原理实施KNN算法示例：手写识别系统K-近邻算法概述简单地说, k-近邻算法采用测量不同特征值之间的距离方法进行分类。 k-近邻算法优点：精度高...

99+

2022-11-12
Python机器学习算法之决策树算法的实现与优缺点

目录1.算法概述2.算法种类3.算法示例4.决策树构建示例5.算法实现步骤 6.算法相关概念7.算法实现代码8.算法优缺点9.算法优化总结1.算法概述决策树算法是在已知各...

99+

2022-11-12
Go语言开发实现机器学习算法的方法与实践

Go语言是一种简洁、快速和高效的编程语言，其在网络开发和服务器编程方面广泛应用。然而，随着人工智能和机器学习的迅猛发展，很多开发者开始关注如何在Go语言中实现机器学习算法。本文将介绍一些在Go语言中开发和实现机器学习算法的方法与实践。首先，...

99+

2023-11-20

机器学习实践 Go语言
Java实现基本排序算法的示例代码

目录1. 概述2. 插入排序2.1 直接插入排序2.2 希尔排序（缩小增量排序） 3. 选择排序3.1 直接选择排序3.2 堆排序4. 交换排序4.1 冒泡排序4.2 快速...

99+

2022-11-13
Android应用开发基础—实现一个简易的计算器学习总结

目录一、前言二、设计思路布局：后台：三、演示：四、总结一、前言学习目标：根据课程所学的相关知识，完成一个简易的计算器，并实现一定的功能。工具环境：Android studio、Java语言实现功能：完成简单的页...

99+

2023-09-29

学习 java android-studio
机器学习强基计划8-1：图解主成分分析PCA算法(附Python实现)

目录 0 写在前面 1 为什么要降维？ 2 主成分分析原理 3 PCA与SVD的联系 4 Python实现 0 写在前面机器学习强基计划聚焦深度和广度，加深对机器学习模型的...

99+

2023-09-21

python 算法人工智能数据挖掘
Python利用机器学习算法实现垃圾邮件的识别

开发工具 **Python版本：**3.6.4 相关模块： scikit-learn模块； jieba模块； numpy模块；以及一些Python自带的模块。环境搭建安装Pyt...

99+

2022-11-12
7个流行的Python强化学习算法及代码实现详解

目录1、Q-learning2、SARSA3、DDPG4、A2C5、PPO6、DQN7、TRPO总结目前流行的强化学习算法包括 Q-learning、SARSA、DDPG、A2C、P...

99+

2023-01-28

Python强化学习算法 Python强化学习
计算机竞赛基于YOLO实现的口罩佩戴检测 - python opemcv 深度学习

文章目录 0 前言1 课题介绍2 算法原理2.1 算法简介2.2 网络架构 3 关键代码4 数据集4.1 安装4.2 打开4.3 选择yolo标注格式4.4 打标签4.5 保存 5 训练6 实现效果6.1 pyqt实现简单G...

99+

2023-08-30

python java
给你选择Python语言实现机器学习算法的三大理由

基于以下三个原因，我们选择Python作为实现机器学习算法的编程语言：(1) Python的语法清晰；(2) 易于操作纯文本文件；(3) 使用广泛，存在大量的开发文档。可执行伪代码 Python具有清晰的...

99+

2022-06-04

给你三大算法
Java 实战项目基于遗传算法学校排课系统的实现流程

一、项目简述本系统功能包括：排课管理，课程管理，讲师管理，班级管理，学生管理，教学资料，学习文档，在线测试，教材列表，教学设计，帮助中心等等功能。二、项目运行环境配置： ...

99+

2022-11-12
Java数据结构之基于比较的排序算法基本原理及具体实现

目录1. 七大基于比较的排序-总览1.1常见基于比较的排序分类1.2时间复杂度，空间复杂度以及稳定性。2.直接插入排序2.1 直接插入排序的基本思想2.2 直接插入排序动画演示2.3...

99+

2022-11-12