pandas.DataFrame的piv

pandas DataFrame piv 2023-01-30 22:01:57 533人浏览八月长安

Python 官方文档：入门教程 => 点击学习

摘要

示例：有如下表需要进行行转列：代码如下： # -*- coding:utf-8 -*- import pandas as pd import Mysqldb from warnings import filterwarnings

示例：

有如下表需要进行行转列：

代码如下：

# -*- coding:utf-8 -*-
import pandas as pd
import Mysqldb
from warnings import filterwarnings
# 由于create table if not exists总会抛出warning，因此使用filterwarnings消除
filterwarnings('ignore', cateGory = mysqldb.Warning)
from sqlalchemy import create_engine
import sys
if sys.version_info.major<3:
  reload(sys)
  sys.setdefaultencoding("utf-8")
  # 此脚本适用于python2和python3
host,port,user,passwd,db,charset="192.168.1.193",3306,"leo","mysql","test","utf8"

def get_df():
  global host,port,user,passwd,db,charset
  conn_config={"host":host, "port":port, "user":user, "passwd":passwd, "db":db,"charset":charset}
  conn = MySQLdb.connect(**conn_config)
  result_df=pd.read_sql('select UserName,Subject,Score from TEST',conn)
  return result_df

def pivot(result_df):
  df_pivoted_init=result_df.pivot('UserName','Subject','Score')
  df_pivoted = df_pivoted_init.reset_index()  # 将行索引也作为DataFrame值的一部分，以方便存储数据库
  return df_pivoted_init,df_pivoted
  # 返回的两个DataFrame，一个是以姓名作index的，一个是以数字序列作index，前者用于unpivot，后者用于save_to_mysql

def unpivot(df_pivoted_init):
  # unpivot需要进行df_pivoted_init二维表格的行、列索引遍历，需要拼SQL因此不能使用save_to_mysql存数据，这里使用SQL和MySQLdb接口存
  insert_sql="insert into test_unpivot(UserName,Subject,Score) values "
  # 处理值为NaN的情况
  df_pivoted_init=df_pivoted_init.fillna(0)
  for col in df_pivoted_init.columns:
    for index in df_pivoted_init.index:
      value=df_pivoted_init.at[index,col]
      if value!=0:
        insert_sql=insert_sql+"('%s','%s',%s)" %(index,col,value)+','
  insert_sql = insert_sql.strip(',')
  global host, port, user, passwd, db, charset
  conn_config = {"host": host, "port": port, "user": user, "passwd": passwd, "db": db, "charset": charset}
  conn = MySQLdb.connect(**conn_config)
  cur=conn.cursor()
  cur.execute("create table if not exists test_unpivot like TEST")
  cur.execute(insert_sql)
  conn.commit()
  conn.close()

def save_to_mysql(df_pivoted,tablename):
  global host, port, user, passwd, db, charset
  """
  只有使用sqllite时才能指定con=connection实例，其他数据库需要使用sqlalchemy生成engine，engine的定义可以添加?来设置字符集和其他属性
  """
  conn="mysql://%s:%s@%s:%d/%s?charset=%s" %(user,passwd,host,port,db,charset)
  mysql_engine = create_engine(conn)
  df_pivoted.to_sql(name=tablename, con=mysql_engine, if_exists='replace', index=False)

# 从TEST表读取源数据至DataFrame结构
result_df=get_df()
# 将源数据行转列为二维表格形式
df_pivoted_init,df_pivoted=pivot(result_df)
# 将二维表格形式的数据存到新表test中
save_to_mysql(df_pivoted,'test')
# 将被行转列的数据unpivot，存入test_unpivot表中
unpivot(df_pivoted_init)

结果如下：

关于Pandas DataFrame类自带的pivot方法：

DataFrame.pivot(index=None, columns=None, values=None)：

Return reshaped DataFrame organized by given index / column values.

这里只有3个参数，是因为pivot之后的结果一定是二维表格，只需要行列及其对应的值，而且也因为是二维表格，unpivot之后is_pass列是肯定会丢失的，因此一开始我就没查这个列。

补充说明：

在学习到Pandas的层次化索引部分时发现了2个很有意思的函数，也可以进行行列互转，其用法如下：

(很久之后我才意识到，pivot只是封装了unstack的一个快捷方式而已，其本质上还是先用set_index建立层次化索引，然后用unstack进行重塑，就像我在下面示例做的操作)

df=pd.DataFrame(np.random.randn(20).reshape(4,5),index=[['a','a','b','b'],[1,2,3,4]],columns=[10,20,30,40,50])
In [96]: df
Out[96]: 
           10        20        30        40        50
a 1  0.945775  0.768337  0.851630 -1.050475 -1.102554
  2 -0.366129  0.353388 -0.722637 -0.056877  1.178270
b 3  0.885536  0.210911  2.067309  1.283721 -0.432906
  4  0.173504  1.263630  1.264698  0.913879  1.156815
In [98]: df.stack()
Out[98]: 
a  1  10    0.945775
      20    0.768337
      30    0.851630
      40   -1.050475
      50   -1.102554
   2  10   -0.366129
      20    0.353388
      30   -0.722637
      40   -0.056877
      50    1.178270
b  3  10    0.885536
      20    0.210911
      30    2.067309
      40    1.283721
      50   -0.432906
   4  10    0.173504
      20    1.263630
      30    1.264698
      40    0.913879
      50    1.156815
In [99]: df.stack().unstack()
Out[99]: 
           10        20        30        40        50
a 1  0.945775  0.768337  0.851630 -1.050475 -1.102554
  2 -0.366129  0.353388 -0.722637 -0.056877  1.178270
b 3  0.885536  0.210911  2.067309  1.283721 -0.432906
  4  0.173504  1.263630  1.264698  0.913879  1.156815

以上利用了Pandas的层次化索引，实际上这也是层次化索引一个主要的用途，结合本例我们可以把代码改成如下：

result_df=pd.read_sql('select UserName,Subject,Score from TEST',conn)
# 在从数据库中获取的数据格式是这样的：
        UserName Subject Score
0        张三      语文   80.0
1        张三      数学   90.0
2        张三      英语   70.0
3        张三      生物   85.0
4        李四      语文   80.0
5        李四      数学   92.0
6        李四      英语   76.0
7        王五      语文   60.0
8        王五      数学   82.0
9        王五      英语   96.0
10       王五      生物   78.0
# 如果要使用层次化索引，那么我们只需要把UserName和Subject列设置为层次化索引，Score为其对应的值即可，我们借用set_index()函数：
df=result_df.set_index(['UserName','Subject'])
In [112]: df.unstack()
Out[112]: 
         Score                  
Subject     数学    生物    英语    语文
UserName                        
张三        90.0  85.0  70.0  80.0
李四        92.0   NaN  76.0  80.0
王五        82.0  78.0  96.0  60.0
# 使用stack可以将unstack的结果转回来，这样就也在形式上实现了行列互转，之后的操作基本一致了。

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: pandas.DataFrame的piv

本文链接: https://www.lsjlt.com/news/179972.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

pandas.DataFrame的piv

示例：有如下表需要进行行转列：代码如下： # -*- coding:utf-8 -*- import pandas as pd import MySQLdb from warnings import filterwarnings...

99+

2023-01-30

pandas DataFrame piv
Pandas.DataFrame重置Series的索引index

这篇文章主要介绍“Pandas.DataFrame重置Series的索引index”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“Pandas.DataFrame重置Series的索引index”文章...

99+

2023-07-05
Pandas.DataFrame重置Series的索引index(reset_index)

目录使用reset_index（）将索引重新分配给序列号基本用法删除原始索引：参数drop更改原始对象：参数inplace使用reset_index（）和set_index（）将索引...

99+

2023-02-23

Pandas.DataFrame重置Series索引 Pandas DataFrame reset_index
Pandas.DataFrame如何重置列的行名

本文小编为大家详细介绍“Pandas.DataFrame如何重置列的行名”，内容详细，步骤清晰，细节处理妥当，希望这篇“Pandas.DataFrame如何重置列的行名”文章能帮助大家解决疑惑，下面跟着小编的思路慢慢深入，一起来学习新知识吧...

99+

2023-07-05
Pandas.DataFrame的行名和列名的修改

目录DataFrame.rename()多个行名和列名的修改原DataFrame的修改（参数inplace）使用lambda表达式和函数进行批处理add_prefix(), add_...

99+

2023-02-22

Pandas.DataFrame行名修改 Pandas.DataFrame列名修改
pandas.DataFrame的for循环迭代的实现

目录pandas.DataFrame for循环的应用逐列检索DataFrame.iteritems()逐行检索DataFrame.iterrows()DataFrame.itert...

99+

2023-02-22

pandas DataFrame for循环 pandas DataFrame for
Pandas.DataFrame行和列的转置的实现

目录pandas.DataFrame.Tpandas.DataFrame.transpose()修改原始对象本身当进行类型转换（广播）时视图和复制如果要交换（转置）pandas.Da...

99+

2023-02-22

Pandas DataFrame行列转置 Pandas.DataFrame行列交换
Pandas.DataFrame重置列的行名实现(set_index)

目录set_index（）的使用方法基本用法将指定的列保留为数据：参数drop分配多索引将索引更改为另一列（重置）更改原始对象：参数inplace读取csv文件等时指定索引使用索引（...

99+

2023-02-23

Pandas.DataFrame重置列 Pandas.DataFrame重置行名
怎么对Pandas.DataFrame进行转置

这期内容当中小编将会给大家带来有关怎么对Pandas.DataFrame进行转置，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。Motivationsometimes，换一种获取数据的方式，可以提高数据获取...

99+

2023-06-08
Pandas.DataFrame行和列如何转置

本篇内容主要讲解“Pandas.DataFrame行和列如何转置”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“Pandas.DataFrame行和列如何转置”吧!如果要交换（转置）pandas....

99+

2023-07-05
pandas.DataFrame Series排序如何使用

这篇文章主要介绍“pandas.DataFrame Series排序如何使用”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“pandas.DataFrame Series排序如何使...

99+

2023-07-05
Pandas.DataFrame的行名和列名如何修改

本文小编为大家详细介绍“Pandas.DataFrame的行名和列名如何修改”，内容详细，步骤清晰，细节处理妥当，希望这篇“Pandas.DataFrame的行名和列名如何修改”文章能帮助大家解决疑惑，下面跟着小编的思路慢慢深入，一起来学习...

99+

2023-07-05
pandas.DataFrame的for循环迭代如何实现

本篇内容主要讲解“pandas.DataFrame的for循环迭代如何实现”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“pandas.DataFrame的for循环迭代如何实现”吧!当使用for...

99+

2023-07-05
pandas.DataFrame中提取特定类型dtype的列

目录select_dtypes（）的基本用法指定要提取的类型：参数include指定要排除的类型：参数excludepandas.DataFrame为每一列保存一个数据类型dtype...

99+

2023-02-23

pandas DataFrame提取特定类型列 pandas取dataframe特定列
Pandas.DataFrame时间序列数据处理的实现

目录如何将一列现有数据指定为DatetimeIndex读取CSV时如何指定DatetimeIndex关于pandas.Series将pandas.DataFrame，pandas.S...

99+

2023-02-23

Pandas.DataFrame时间序列 Pandas时间序列处理
Pandas.DataFrame删除指定行和列(drop)的实现

目录DataFrame指定的行删除按行名指定（行标签）按行号指定未设置行名的注意事项DataFrame指定的列删除按列名指定（列标签）按列号指定多行多列的删除使用drop（）方法删除...

99+

2023-02-22

Pandas DataFrame删除指定行列 Pandas DataFrame删除行列
pandas.DataFrame中如何提取特定类型dtype的列

本篇内容介绍了“pandas.DataFrame中如何提取特定类型dtype的列”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！pandas....

99+

2023-07-05
Pandas.DataFrame怎么删除指定行和列

本篇内容主要讲解“Pandas.DataFrame怎么删除指定行和列”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“Pandas.DataFrame怎么删除指定行和列”吧!Pandas删除，替换并...

99+

2023-07-05
Pandas.DataFrame时间序列数据处理如何实现

本篇内容主要讲解“Pandas.DataFrame时间序列数据处理如何实现”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“Pandas.DataFrame时间序列数据处理如何实现”吧!将panda...

99+

2023-07-05
pandas.DataFrame设置某一行为表头（列索引），设置某一列为行索引，按索引取多行多列

pandas读取文件 pandas.DataFrame 设置索引 pandas.DataFrame 读取单行/列，多行多列 pandas.DataFrame 添加行/列利用pandas处理表格类型数...

99+

2023-09-15

pandas python 数据分析