首页 > 资讯 > 后端开发 > Python >【Python | 深度学习】safetensors 包的介绍和使用案例（含源代码）

432

分享到

【Python | 深度学习】safetensors 包的介绍和使用案例（含源代码）

深度学习 python pytorch 2023-10-12 16:10:31 432人浏览八月长安

Python 官方文档：入门教程 => 点击学习

摘要

safetensors 是一种用于安全存储张量（与 pickle 相反）的新型简单格式，并且仍然很快（零拷贝）。 safetensors 真的很快。一、安装 1.1 pip 安装 pip insta

safetensors 是一种用于安全存储张量（与 pickle 相反）的新型简单格式，并且仍然很快（零拷贝）。

safetensors 真的很快。

一、安装

1.1 pip 安装

pip install safetensors

1.2 conda 安装

conda install -c huggingface safetensors

二、加载张量

from safetensors import safe_opentensors = {}with safe_open("model.safetensors", framework="pt", device=0) as f:    for k in f.keys():        tensors[k] = f.get_tensor(k)

仅加载部分张量（在多个GPU上运行时很有趣）：

from safetensors import safe_opentensors = {}with safe_open("model.safetensors", framework="pt", device=0) as f:    tensor_slice = f.get_slice("embedding")    vocab_size, hidden_dim = tensor_slice.get_shape()    tensor = tensor_slice[:, :hidden_dim]

三、保存张量

import torchfrom safetensors.torch import save_filetensors = {    "embedding": torch.zeros((2, 2)),    "attention": torch.zeros((2, 3))}save_file(tensors, "model.safetensors")

四、速度比较

4.1 下载 gpt2 的文件

safetensors 真的很快。让我们通过加载 gpt2 权重将其进行比较。要运行 GPU 基准测试，请确保您的机器具有 GPU，或者您已选择是否使用的是 Google Colab。

在开始之前，请确保已安装所有必要的库：

pip install safetensors huggingface_hub torch

让我们从导入所有将使用的包开始：

import osimport datetimefrom huggingface_hub import hf_hub_downloadfrom safetensors.torch import load_fileimport torch

Download safetensors & torch weights for gpt2：

sf_filename = hf_hub_download("gpt2", filename="model.safetensors")pt_filename = hf_hub_download("gpt2", filename="PyTorch_model.bin")

在这里插入图片描述

4.2 CPU 基准测试

start_st = datetime.datetime.now()weights = load_file(sf_filename, device="cpu")load_time_st = datetime.datetime.now() - start_stprint(f"Loaded safetensors {load_time_st}")

输出结果为：

Loaded safetensors 0:00:00.026842

start_pt = datetime.datetime.now()weights = torch.load(pt_filename, map_location="cpu")load_time_pt = datetime.datetime.now() - start_ptprint(f"Loaded pytorch {load_time_pt}")

输出结果为：

Loaded pytorch 0:00:00.182266

print(f"on CPU, safetensors is faster than pytorch by: {load_time_pt/load_time_st:.1f} X")

输出结果为：

on CPU, safetensors is faster than pytorch by: 6.8 X

这种加速是由于该库通过直接映射文件来避免不必要的副本。实际上可以在 torch 上完成。当前显示的加速比已打开：

操作系统： windows
处理器：英特尔® 至强® CPU @ 2.00GHz

4.3 GPU 基准测试

os.environ["SAFETENSORS_FAST_GPU"] = "1"torch.zeros((2, 2)).cuda()start_st = datetime.datetime.now()weights = load_file(sf_filename, device="cuda:0")load_time_st = datetime.datetime.now() - start_stprint(f"Loaded safetensors {load_time_st}")start_pt = datetime.datetime.now()weights = torch.load(pt_filename, map_location="cuda:0")load_time_pt = datetime.datetime.now() - start_ptprint(f"Loaded pytorch {load_time_pt}")print(f"on GPU, safetensors is faster than pytorch by: {load_time_pt/load_time_st:.1f} X")

输出结果为：

Loaded safetensors 0:00:00.497415Loaded pytorch 0:00:00.250602on GPU, safetensors is faster than pytorch by: 0.5 X

加速有效是因为此库能够跳过不必要的 CPU 分配。不幸的是，据我们所知，它无法在纯 pytorch 中复制。该库的工作原理是内存映射文件，使用 pytorch 创建空张量，并直接调用以直接在 GPU 上移动张量。

显卡：GTX 3060

来源地址：https://blog.csdn.net/wzk4869/article/details/130668642

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: 【Python | 深度学习】safetensors 包的介绍和使用案例（含源代码）

本文链接: https://www.lsjlt.com/news/429630.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

【Python | 深度学习】safetensors 包的介绍和使用案例（含源代码）

safetensors 是一种用于安全存储张量（与 pickle 相反）的新型简单格式，并且仍然很快（零拷贝）。 safetensors 真的很快。一、安装 1.1 pip 安装 pip insta...

99+

2023-10-12

深度学习 python pytorch
动手学深度学习(李沐)的pytorch版本（包含代码和PDF版本）

目录网址（特别适合自学）说明: 代码与PDF版网址（特别适合自学）传送门界面一览：说明: github上一个项目将《动手学深度学习》从mxnet改为了pytorch实现。感谢大佬们的工作。特别说明该电子版网页是通...

99+

2023-09-02

深度学习 pytorch 人工智能手动学深度学习 python
联邦学习算法介绍-FedAvg详细案例-Python代码获取

联邦学习算法介绍-FedAvg详细案例-Python代码获取一、联邦学习系统框架二、联邦平均算法（FedAvg）三、联邦随梯度下降算法 (FedSGD）四、差分隐私随联邦梯度下降算法 (DP...

99+

2023-08-31

python 算法机器学习
深度学习之python使用指定gpu运行代码

一、前提 1、在命令行使用nvidia-smi查看gpu设备情况，当存在空闲设备时才能用，否则会出现运行内存不够出错的情况（具体参考文章GPU之nvidia-smi命令详解）； 2、安装好cuda和c...

99+

2023-09-04

python 深度学习开发语言
【深度学习时间序列预测案例】零基础入门经典深度学习时间序列预测项目实战（附代码+数据集+原理介绍）

🚨注意🚨：最近经粉丝反馈，发现有些订阅者将此专栏内容进行二次售卖，特在此声明，本专栏内容仅供学习，不得以任何方式进行售卖，未经作者许可不得对本专栏内容行使发表权、署名...

99+

2023-08-30

深度学习 python 人工智能神经网络 pytorch
jQuery LigerUI 插件介绍及使用之ligerDrag和ligerResizable示例代码打包

ligerDrag() 使目标对象可以拖动。参数　　handler 　　　　拖动的作用区域，在这个区域才可以触发拖动。可以是字符串(jQuery selector)，也可以是一个...

99+

2022-11-21

jQuery LigerUI ligerDrag ligerResizable
时间序列预测模型实战案例(三)(LSTM)(Python)(深度学习)时间序列预测(包括运行代码以及代码讲解)

目录引言 LSTM的预测效果图 LSTM机制了解LSTM的结构忘记门输入门输出门 LSTM的变体只有忘记门的LSTM单元独立循环(IndRNN)单元双向RNN结构(LSTM) 运行代码代码讲解引言 LSTM（Long...

99+

2023-10-20

深度学习 lstm python 算法
如何查询chatgpt-API-KEY接口的使用额度，代码php和python源码

ChatGPT是一款由OpenAI开发的强大自然语言处理模型，可以帮助开发者实现各种自然语言相关的应用场景。为了能够使用ChatGPT，开发者需要通过OpenAI获取API-KEY，然后才能使用模型接口进行开发。但是，在使用ChatG...

99+

2023-08-31

chatgpt
使用Python编写并实现一个具备人工智能的聊天机器人（包含代码和步骤）

聊天机器人是一种人工智能，它通过应用程序或消息来模拟与用户的对话。本文我们将使用Pytho的chatterbot库来实现聊天机器人。该库生成对用户输入的自动响应。响应基于库中实现的机器学习算法。机器学习算法使聊天机器人在收集用...

99+

2024-01-22

人工智能机器学习