首页 > 资讯 > 后端开发 > Python >详解使用PytorchGeometric实现GraphSAGE模型

232

分享到

详解使用PytorchGeometric实现GraphSAGE模型

Pytorch Geometric GraphSAGE Pytorch Geometric GraphSAGE模型实现 2023-05-17 11:05:59 232人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

目录正文图构建Sampler方法GraphSAGE模型定义模型训练与测试总结正文 GraphSAGE是一种用于图神经网络中的节点嵌入学习方法。它通过聚合节点邻居的信息来生成节点的低维

正文

GraphSAGE是一种用于图神经网络中的节点嵌入学习方法。它通过聚合节点邻居的信息来生成节点的低维表示，使节点表示能够更好地应用于各种下游任务，如节点分类、链路预测等。

图构建

在使用GraphSAGE对节点进行嵌入学习之前，我们需要先将原始数据转换为图结构，并将其存储为PyTorch Tensor格式。例如，我们可以使用networkx库来构建一个简单的图：

import networkx as nx

G = nx.karate_club_graph()

然后，我们可以使用Pytorch Geometric库将NetworkX图转换为Pytorch Tensor格式。首先，我们需要安装Pytorch Geometric并导入所需的类：

!pip install torch-geometric

from torch_geometric.datasets import Planetoid
from torch_geometric.transfORMs import NormalizeFeatures
from torch_geometric.utils.convert import from_networkx

接着，我们可以使用from_networkx函数将NetworkX图转换为Pytorch Tensor格式：

data = from_networkx(G)

此时，data对象包含了关于节点、边及其属性的信息，例如：

data.edge_index: 2x(#edges)的长整型张量，表示边的起点和终点

data.x: n×dn \times dn×d 的浮点型张量，表示每个节点的特征向量（其中nnn是节点数量，DDD是特征维度）

注意，此时的data对象并未包含邻居信息。接下来，我们将介绍如何使用Sampler方法采样节点邻居。

Sampler方法

GraphSAGE使用Sampler方法来聚合邻居信息。在Pytorch Geometric中，可以使用Various Sampling方法来实现Sampler。例如，使用ClusterData方法将图分成多个子图，然后对每个子图进行采样操作。

以下是ClusterData的使用示例：

from torch_geometric.utils import degree, to_undirected
from torch_geometric.transforms import ClusterData

# Convert the graph to an undirected graph, so we can aggregate neighbors in both directions.
G = to_undirected(G)

# Compute the degree of each node.
deg = degree(data.edge_index[0], num_nodes=data.num_nodes)

# Use METIS alGorithm to partition the graph into multiple subgraphs.
cluster_data = ClusterData(data, num_parts=2, recursive=False, transform=NormalizeFeatures(),
                           degree=deg)

这里我们将原始图分成两个子图，并对每个子图进行规范化特征转换。注意，在使用ClusterData方法之前，需要将原始图转换为无向图。

另一个常用的Sampler方法是在随机游动时对邻居进行采样，这种方法被称为随机游走采样（Random Walk Sampling）。以下是随机游走采样的示例代码：

from torch_geometric.utils import random_walk

# Perform random walk sampling to obtain node neighbor samples.
walk_length = 20  # The length of random walk trail.
num_steps = 4     # The number of nodes to sample from each step.
data.batch = None
data.edge_index = to_undirected(data.edge_index)  # Use undirected edge for random walk.

rw_data = random_walk(data.edge_index, walk_length=walk_length, num_steps=num_steps)

这里我们将使用一个长度为20、每个步骤采样4个邻居的随机游走方法。注意，在使用随机游走方法进行采样之前，需要使用无向边。

GraphSAGE模型定义

GraphSAGE模型包含3个部分：1）图卷积层；2）聚合器（Aggregator）；3）输出层。我们将在本节中介绍如何使用Pytorch实现这些组件。

首先，让我们定义一个图卷积层。图卷积层的输入是节点特征矩阵、邻接矩阵和聚合器，输出是新的节点特征矩阵。以下是图卷积层的代码实现：

import torch.nn.functional as F
from torch_geometric.nn.conv import MessagePassing
from torch_geometric.nn import global_mean_pool

class GraphSageConv(MessagePassing):
    def __init__(self, in_channels, out_channels, aggr='mean'):
        super(GraphSageConv, self).__init__(aggr=aggr)
        self.lin = nn.Linear(in_channels, out_channels)
        
    def forward(self, x, edge_index):
        return self.propagate(edge_index, x=x)
    
    def message(self, x_j):
        return x_j
    
    def update(self, aggr_out, x):
        return F.relu(self.lin(torch.cat([x, aggr_out], dim=1)))

这里我们继承了MessagePassing类，并在__init__函数中定义了一个全连接层，用于将输入特征矩阵x从 dind_{in}din 维映射到 doutd_{out}dout 维。在forward函数中，我们使用propagate方法来实现消息传递操作；在message函数中，我们仅向下游节点发送原始特征数据；在update函数中，我们首先对聚合结果进行ReLU非线性变换，然后再通过全连接层进行节点特征的更新。

接下来，让我们定义一个聚合器。聚合器的输入是采样得到的邻居特征矩阵，输出是新的节点嵌入向量。以下是聚合器的代码实现：

class MeanAggregator(nn.Module):
    def __init__(self, input_dim, output_dim):
        super(MeanAggregator, self).__init__()
        self.input_dim = input_dim
        self.output_dim = output_dim
        self.lin = nn.Linear(input_dim, output_dim)
        
    def forward(self, neigh_mean):
        out = F.relu(self.lin(neigh_mean))
        return out

这里我们定义了一个简单的均值聚合器，其将邻居特征矩阵中每列的均值作为节点嵌入向量，并使用全连接层进行维度变换。

最后，让我们定义整个GraphSage模型。GraphSage模型包含2个图卷积层和1个输出层。以下是模型的代码实现：

class GraphSAGE(nn.Module):
    def __init__(self, in_channels, hidden_channels, out_channels, num_layers=2):
        super(GraphSAGE, self).__init__()
        self.conv1 = GraphSageConv(in_channels, hidden_channels)
        self.aggreg1 = MeanAggregator(hidden_channels, hidden_channels)
        self.conv2 = GraphSageConv(hidden_channels, out_channels)
        
    def forward(self, x, edge_index):
        x = self.conv1(x, edge_index)
        x = global_mean_pool(x, edge_index)  # Compute global mean over nodes.
        x = self.aggreg1(x)
        x = self.conv2(x, edge_index)
        return x

这里我们定义了一个包含2层GraphSAGE Conv层的神经网络。在最后一层GraphSAGE Conv层之后，我们使用global_mean_pool函数来计算节点嵌入的全局平均值。注意，在本示例中，我们仅保留了一个输出节点，因此输出矩阵的大小为1。如果需要输出多个节点，则需要设置global_mean_pool函数中的参数。

模型训练与测试

在定义好模型后，我们可以使用Pytorch进行模型训练和测试。首先，让我们定义一个损失函数和优化器：

criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.01)

这里我们使用交叉熵作为损失函数，并使用Adam优化器来更新模型参数。

接着，我们可以开始训练模型。以下是训练过程的代码实现：

num_epochs = 100

for epoch in range(num_epochs):
    model.train()
    
    optimizer.zero_grad()
    out = model(data.x, data.edge_index)
    loss = criterion(out[data.train_mask], data.y[data.train_mask])
    loss.backward()
    optimizer.step()
    
    print('Epoch {:03D}, Loss: {:.4f}'.format(epoch, loss.item()))

这里我们遍历所有数据样本，计算预测结果和真实标签之间的交叉熵损失，并使用反向传播来更新权重。我们在每个epoch结束后打印出当前损失值。

最后，我们可以对模型进行测试。以下是测试过程的代码实现：

model.eval()

with torch.no_grad():
    pred = model(data.x, data.edge_index)
    pred = pred.argmax(dim=1)

acc = (pred[data.test_mask] == data.y[data.test_mask]).sum().item() / data.test_mask.sum().item()
print('Test accuracy: {:.4f}'.format(acc))

这里我们使用测试集来计算模型的准确率。注意，在执行model.eval()后，我们需要使用torch.no_grad()包装代码块，以禁止梯度计算。

总结

介绍了如何使用Pytorch Geometric实现GraphSAGE模型，包括构建图、定义Sampler方法、定义模型、训练和测试模型等步骤。GraphSAGE模型是一种常用的节点嵌入学习方法，可以应用于各种下游任务中。

以上就是详解使用Pytorch Geometric实现GraphSAGE模型的详细内容，更多关于Pytorch Geometric GraphSAGE的资料请关注编程网其它相关文章！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: 详解使用PytorchGeometric实现GraphSAGE模型

本文链接: https://www.lsjlt.com/news/211114.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

详解使用PytorchGeometric实现GraphSAGE模型

目录正文图构建Sampler方法GraphSAGE模型定义模型训练与测试总结正文 GraphSAGE是一种用于图神经网络中的节点嵌入学习方法。它通过聚合节点邻居的信息来生成节点的低维...

99+

2023-05-17

Pytorch Geometric GraphSAGE Pytorch Geometric GraphSAGE模型实现
Pytorch+PyG实现GraphSAGE过程示例详解

目录GraphSAGE简介实现步骤数据准备实现模型模型训练GraphSAGE简介 GraphSAGE（Graph Sampling and Aggregation）是一种常见的图神经...

99+

2023-05-17

Pytorch PyG实现GraphSAGE Pytorch PyG
Python使用描述器实现ORM模型的方法详解

目录1.__set__方法：设置属性 2.__get__方法：访问属性3.__delete__方法：删除属性 4.描述器实现ORM模型：总结访问或者修...

99+

2024-04-02
Python使用机器学习模型实现温度预测详解

目录温度预测回归分析温度预测随机森林 Python 写法使用 Python 可以使用机器学习模型进行温度预测。常用的模型有回归分析、随机森林等。使用前需要准备足够的历史数据并进行...

99+

2023-01-31

Python机器学习温度预测 Python温度预测 Python 预测
Three.jsGLTF模型加载实现示例详解

目录引言1. 下载GLTF模型2. 加载GLTF模型3. 添加光源4. 动画控制总结引言在Three.js中，要加载三维模型文件，可以使用GLTF格式。GLTF是一种基于JSON...

99+

2023-05-16

Three.js GLTF模型加载 Three.js GLTF
Transformer模型入门详解及代码实现

目录前言一.什么是Transformer 二.Encoder的组成 1.输入部分 2.注意力机制 2.1注意力机制的含义 2.2在TRM中的实现 3.前馈神经网络 3.1 前馈神经网络，BP算法，BP神经网络的区别： 3.2Encode...

99+

2023-10-18

transformer 深度学习人工智能 nlp python
Keras实现Vision Transformer VIT模型示例详解

目录什么是Vision Transformer（VIT）Vision Transforme的实现思路一、整体结构解析二、网络结构解析1、特征提取部分介绍2、分类部分Vision Tr...

99+

2024-04-02
一文详解如何实现PyTorch模型编译

目录准备加载预训练的 PyTorch 模型加载测试图像将计算图导入 RelayRelay 构建在 TVM 上执行可移植计算图查找分类集名称准备本篇文章译自英文文档 Co...

99+

2023-05-17

PyTorch 模型编译 PyTorch 模型
详解Laravel模型事件和模型事件在Trait中的使用

目录模型事件事件类型boot 方法和事件注册boot 在 traits 中的使用boot(启动) 和 initialize(初始化)Boot(启动)Initialize (初始化)模...

99+

2023-03-07

Laravel模型事件Trait Laravel Trait
Docker网络模型使用详解（2）Docker网络模式

安装Docker时会自动创建3个网络，可以使用docker network ls命令列出这些网络。 [root@localhost ~]# docker network ls NETWORK ID NAME ...

99+

2023-09-08

docker 容器 linux 运维
如何使用Pytorch实现two-head模型

这篇文章将为大家详细讲解有关如何使用Pytorch实现two-head模型，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。如何使用Pytorch实现two-head（多输出）模型1. two-head模型定...

99+

2023-06-15
如何使用Laravel实现模型关联

这篇文章主要介绍了如何使用Laravel实现模型关联的相关知识，内容详细易懂，操作简单快捷，具有一定借鉴价值，相信大家阅读完这篇如何使用Laravel实现模型关联文章都会有所收获，下面我们一起来看看吧。一对一一对一关联是目前存在的最基本的关...

99+

2023-07-04
详解利用Pytorch实现ResNet网络之评估训练模型

目录正文评估模型训练 ResNet50 模型正文每个 batch 前清空梯度，否则会将不同 batch 的梯度累加在一块，导致模型参数错误。然后我们将输入和目标张量都移动到所需的...

99+

2023-05-16

Pytorch ResNet网络 Pytorch ResNet
C++使用宏函数实现单例模板详解

目录ISingleton.hpp使用方式Aclass.hAclass.cppmain.c在我们日常开发中，无可避免需要使用单例模式进行设计类对象，那么实际上我们写单例格式基本都是一样...

99+

2023-02-10

C++宏函数实现单例模板 C++ 单例模板 C++宏函数
pytorch实践线性模型3d详解

y = wx +b通过meshgrid 得到两个二维矩阵关键理解：plot_surface需要的xyz是二维np数组这里提前准备meshgrid来生产x和y需要的参数下图的W和I即p...

99+

2023-05-15

pytorch线性模型 pytorch线性模型3d
Java中泛型使用实例详解

Java中泛型使用泛型作用：泛型：集合类添加对象不用强转反射机制：将泛型固定的类的所有方法和成员全部显示出来核心代码：ArrayList<Ls> ff=new ArrayList()<Ls>;Ls ls1...

99+

2023-05-31

java 泛型 ava
【RabbitMQ】常用消息模型详解

文章目录 AMQP协议的回顾RabbitMQ支持的消息模型第一种模型(直连)开发生产者开发消费者生产者、消费者开发优化API参数细节第二种模型(work quene)开发生产者开发消费者消息自动确认机制第三种模型(fan...

99+

2023-08-17

java-rabbitmq rabbitmq java
PyTorch模型转换为ONNX格式实现过程详解

目录1. 安装依赖2. 准备模型3. 调整输入和输出节点4. 运行转换程序5. 使用后端框架测试ONNX模型6. 核对结果1. 安装依赖将PyTorch模型转换为ONNX格式可以使...

99+

2023-05-17

PyTorch模型转换为ONNX格式 PyTorch转换ONNX
一文详解Python灰色预测模型实现示例

目录前言一、模型理论特点二、模型场景1.预测种类2.适用条件三、建模流程1.级比校验3.系数求解 4.残差检验与级比偏差检验四、Python实例实现总结前言博主参与过大...

99+

2023-02-15

Python灰色预测模型 Python 模型预测
使用Python怎么实现一个ORM模型

本篇文章为大家展示了使用Python怎么实现一个ORM模型，内容简明扼要并且容易理解，绝对能使你眼前一亮，通过这篇文章的详细介绍希望你能有所收获。元类对于元类，我的理解其实也便较浅，大概是这个意思所有的类都是使用元类来进行创建的，而所有的类...

99+

2023-06-15