iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >在Python中进行One-Hot编码
  • 854
分享到

在Python中进行One-Hot编码

2024-04-02 19:04:59 854人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

目录1.介绍​2.什么是One-Hot编码?​3.实现-pandas​​4.实现-Scikit-Learn​5.​One-hot编码在机器学习领域的应用​1.介绍​   &

1.介绍​

      在计算机科学中,数据可以用很多不同的方式表示,自然而然地,每一种方式在某些领域都有其优点和缺点。
      由于计算机无法处理分类数据,因为这些类别对它们没有意义,如果我们希望计算机能够处理这些信息,就必须准备好这些信息。
      此操作称为预处理。 预处理的很大一部分是编码 - 以计算机可以理解的方式表示每条数据(该名称的字面意思是“转换为计算机代码”)。
      在计算机科学的许多分支中,尤其是机器学习和数字电路设计中,One-Hot Encoding 被广泛使用。
      在本文中,我们将解释什么是 one-hot 编码,并使用一些流行的选择(Pandas 和 Scikit-Learn)在 python 中实现它。 我们还将比较它与计算机中其他类型表示的有效性、优点和缺点,以及它的应用。

2.什么是One-Hot编码?

      One-hot Encoding 是一种向量表示,其中向量中的所有元素都是 0,除了一个,它的值是 1,其中 1 表示指定元素类别的布尔值。

      还有一个类似的实现,称为One-Cold Encoding,其中向量中的所有元素都是 1,除了 1 的值是 0。

      例如,[0, 0, 0, 1, 0] 和 [1 ,0, 0, 0, 0] 可以是One-hot 向量的一些示例。 与此类似的技术,也用于表示数据,例如统计中的虚拟变量。

      这与其他编码方案非常不同,其他编码方案都允许多个位的值为 1。 下表比较了从 0 到 7 的数字在二进制、格雷码和 one-hot 中的表示:

实际上,对于每个 one-hot 向量,我们会问 n 个问题,其中 n 是我们拥有的类别数:

      这是数字1吗? 这是数字2吗? ......这是数字7吗?

      每个“0”都是“假”,一旦我们在向量中找到“1”,问题的答案就是“真”。

      One-hot 编码将分类特征转换为一种更适合分类和回归算法的格式。 它在需要多种类型数据表示的方法中非常有用。

例如,一些向量可能最适合回归(基于以前的返回值逼近函数),而一些可能最适合分类(分类为固定集/类,通常是二元的):

这里我们有六个分类数据的样本输入。 此处使用的编码类型称为“label encoding”——它非常简单:我们只需为分类值分配一个 ID。

      我们的计算机现在知道如何表示这些类别,因为它知道如何处理数字。 然而,这种编码方法并不是很有效,因为它自然会赋予更高的数字更高的权重。

      说我们的“Strawberries”类别大于或小于“Apples”是没有意义的,或者将类别“Lemon”添加到“Peach”会给我们一个类别“Orange”,因为这些值不是序数。

      如果我们用 one-hot 编码表示这些类别,我们实际上会用列替换行。 我们通过为每个给定类别创建一个布尔列来实现这一点,其中只有这些列之一可以为每个样本取值 1:

我们可以从上表中看出,与二进制或格雷码相比,one-hot 表示需要更多的数字。 对于n个数字,one-hot编码只能表示n个值,而Binary或Gray编码可以用n个数字表示2n个值。

​3.实现-Pandas​

      让我们看一个简单的示例,说明如何通过 one-hot 编码方案将数据集中的分类列中的值转换为对应的数值。    

我们将创建一个非常简单的数据集 - 国家及其 ID 的列表:

       在上面的脚本中,我们使用两个列表(即 ids 和国家/地区)创建了一个Pandas dataframe,称为 df。 如果您在数据帧上调用 head() 方法,会看到以下结果:

Countries列包含分类值。 我们可以使用 get_dummies() 函数将Countries列中的值转换为one-hot编码向量:

我们将 Country 作为 get_dummies() 方法的前缀属性的值传递,因此您可以在输出中的每个单热编码列的标题之前看到字符串 Country 前缀。

​4.实现-Scikit-Learn​

      另一种方法是使用另一个流行的库 - Scikit-Learn。 为此,它提供了 OneHotEncoder 类和 LabelBinarizer 类。

首先,导入库LabelBinarizer:

打印y值:

同样,我们可以使用支持多列数据的 OneHotEncoder 类,与之前的类不同:

5.​One-hot编码在机器学习领域的应用​

      如上所述,计算机不太擅长处理分类数据。 虽然我们很好地理解分类数据,但这是由于计算机不具备的一种先决知识。

      大多数机器学习技术和模型使用非常有限的数据集(通常是二进制)。 神经网络消耗数据并产生 0..1 范围内的结果,我们很少会超出该范围。

      简而言之,绝大多数机器学习算法都会接收样本数据(“训练数据”),从中提取特征。 基于这些特征,创建了一个数学模型,然后用于进行预测或决策,而无需明确编程来执行这些任务。

      一个很好的例子是分类,其中输入在技术上可以是无界的,但输出通常仅限于几个类别。 在二元分类的情况下(假设我们正在教一个神经网络对猫和狗进行分类),我们的映射为 0 代表猫,1 代表狗。

      大多数情况下,我们希望对其进行预测的训练数据是分类的,就像上面提到的带有水果的例子一样。 同样,虽然这对我们很有意义,但这些词本身对算法没有意义,因为它不理解它们。

      在这些算法中使用one-hot编码来表示数据在技术上不是必需的,但如果我们想要一个有效的实现,它非常有用。

到此这篇关于在 Python 中进行 One-Hot 编码的文章就介绍到这了,更多相关 Python 中进行 One-Hot 编码内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: 在Python中进行One-Hot编码

本文链接: https://www.lsjlt.com/news/139954.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 在Python中进行One-Hot编码
    目录1.介绍​2.什么是One-Hot编码?​3.实现-Pandas​​4.实现-Scikit-Learn​5.​One-hot编码在机器学习领域的应用​1.介绍​   &...
    99+
    2024-04-02
  • one-hot编码
    one-hot编码 什么是one-hot编码 one-hot编码,又称独热编码、一位有效编码。其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位...
    99+
    2023-09-04
    人工智能 python 机器学习
  • One Hot编码指的是什么
    这篇文章给大家介绍One Hot编码指的是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。导读  当你在玩ML模型的时候,你会在任何地方遇到这个“One hot encoding”的术语。当你在玩ML模型...
    99+
    2023-06-19
  • 机器学习数据预处理之独热One-Hot编码及其代码详解
    目录1. 为什么使用 one-hot 编码?问题:目的:瓶颈:2. 什么是 one-hot 编码?定义:理解:举例1:举例2:3. one-hot 编码优缺点?优点:缺点:1. 为什...
    99+
    2024-04-02
  • 如何在Python中进行网络编程
    如何在Python中进行网络编程,需要具体代码示例网络编程是现代计算机科学中非常重要的一个领域,它涉及到在网络上进行数据传输和通信的技术和方法。Python是一种强大而灵活的编程语言,它具有丰富的网络编程库,使得在Python中进行网络编程...
    99+
    2023-10-22
    Python 编程 网络编程
  • Python中如何对HTTP响应进行编码和解码?
    Python中如何对HTTP响应进行编码和解码? 在网络编程中,HTTP协议是非常常见的一种协议。在使用Python进行HTTP请求时,经常需要对HTTP响应进行编码和解码。本文将介绍如何使用Python对HTTP响应进行编码和解码。 HT...
    99+
    2023-07-07
    http 响应 django
  • 如何进行Python代码的编写
    这篇文章将为大家详细讲解有关如何进行Python代码的编写,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。Python 调用在日常工作中还是非常实用的,只需要Python函数就可以了,如果对P...
    99+
    2023-06-17
  • 如何在Python中进行图形界面编程
    如何在Python中进行图形界面编程Python 是一种简单易学但功能强大的编程语言,它提供了丰富的库和工具,使得开发图形界面变得容易。无论你是要开发桌面应用程序、游戏还是其他图形界面应用,Python 都可以提供相应的解决方案。本文将介绍...
    99+
    2023-10-22
    Python 编程 图形界面
  • Python之进行URL编码案例讲解
    为什么要对URL进行encode 在写网络爬虫时,发现提交表单中的中文字符都变成了TextBox1=%B8%C5%C2%CA%C2%DB这种样子,观察这是中文对应的GB2312编码,...
    99+
    2024-04-02
  • 怎样进行Python源代码的编译
    怎样进行Python源代码的编译,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。在计算机语言中Python源代码一般的情况下是不进行编译的,只是通过几个文件就能运用的。我们一般使...
    99+
    2023-06-17
  • 对python源码进行编译,加密pyth
    对python源码进行编译 1.生成.pyc文件import py_compilepy_compile.compile('hello.py') 2.优化源码文件python -O -m py_compile 1.py生成.pyo文件...
    99+
    2023-01-31
    源码 python pyth
  • 如何在 Shell 中使用 Python 进行高效编程?
    Shell 是一个功能强大的命令行工具,而 Python 是一种高级编程语言,两者结合使用可以帮助我们更加高效地进行编程。本篇文章将介绍如何在 Shell 中使用 Python 进行高效编程,并且会穿插一些演示代码来帮助你更好地理解。 一、...
    99+
    2023-09-07
    linux shell leetcode
  • 如何使用 Python 在 Linux 系统中进行编程?
    Python 是一种流行的编程语言,它具有简单易学、功能强大、可移植性好等特点。如果你正在使用 Linux 系统,并且想要使用 Python 进行编程,那么这篇文章就是为你准备的。在这篇文章中,我们将介绍如何在 Linux 系统中使用 Py...
    99+
    2023-09-23
    http linux npm
  • 如何在Python编程算法中使用对象进行编程?
    在Python编程中,对象是一种非常重要的概念。通过使用对象,开发者可以更加轻松地编写复杂的算法和数据结构。本文将介绍如何在Python编程算法中使用对象进行编程,并通过代码演示来帮助读者更好地理解。 一、什么是对象? 在Python中,对...
    99+
    2023-10-16
    编程算法 对象 编程算法
  • Python中怎么对XML文件的编码进行转换
    1. 在 Python 中 XML 文件的编码问题1.Python 使用的xml.etree.ElementTree库只支持解析和生成标准的UTF-8格式的编码2.常见GBK或GB2312等中文编码的 XML 文件,用以在老旧系统中保证 X...
    99+
    2023-05-21
    Python xml
  • 如何使用Python在Linux中进行脚本编写和执行
    如何使用Python在Linux中进行脚本编写和执行在Linux操作系统中,我们可以使用Python编写并执行各种脚本。Python是一种简洁而强大的编程语言,它提供了丰富的库和工具,使得脚本编写变得更加简单和高效。下面我们将介绍在Linu...
    99+
    2023-10-22
    linux脚本 执行 Python编程
  • Python怎么将内容进行base64编码与解码
    这篇文章主要讲解了“Python怎么将内容进行base64编码与解码”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python怎么将内容进行base64编码与解码”吧!一、需求说明需要使用P...
    99+
    2023-07-05
  • Python将内容进行base64编码与解码实现
    目录一、需求说明二、base64简介三、base64编码解码3.1、Python中base64编码解码3.2、Python使用示例一、需求说明 需要使用Python实现将内容转为ba...
    99+
    2023-03-01
    Python base64编码与解码 Python base64编码
  • 用Python进行编码的技巧有哪些
    本篇内容主要讲解“用Python进行编码的技巧有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“用Python进行编码的技巧有哪些”吧!1. 可读性的重要性程序必须为了人们能够读懂而编写,其次...
    99+
    2023-06-16
  • 如何在PHP中进行Socket编程?
    随着互联网技术的不断发展,越来越多的应用需要使用Socket来进行网络通信。而PHP是一种在Web应用开发中应用广泛的语言,也支持Socket编程。在本文中,我将介绍如何使用PHP进行Socket编程。一、Socket简介在介绍Socket...
    99+
    2023-05-21
    编程 PHP socket
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作