Transpose rows of a Multi-index df into columns(将多索引DF的行转置为列)
本文介绍了将多索引DF的行转置为列的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一个如下所示的df:
pid time
id vid
id1 vis_id1 pid1 t_0
vis_id1 pid2 t_1
id2 vis_id2 pid1 t_3
vis_id2 pid2 t_4
vis_id2 pid3 t_5
vis_id2 pid4 t_6
我希望为pid
和time
调换n
和n
的df行,每个i
之前:
pid time
id vid
id1 vis_id1 pid1 t_0
vis_id1 pid2 t_1
id2 vis_id2 pid2 t_3
vis_id2 pid2 t_4
vis_id2 pid3 t_5
vis_id2 pid4 t_6
之后:
step1 step2 step3 step4
id vid
id1 vis_id1 pid1 pid2 NA NA
id2 vis_id2 pid1 pid2 pid3 pid4
因此,原来的pid
变为步骤1(我只能在转置之前重命名该列),然后将前面的pids
转置,以便它们保持它们的顺序(向上->向下)到(左->右)。删除带有时间的列也会很有帮助。
推荐答案
我们可以根据Level=0使用groupby cumcount
枚举组,作为索引的附加级别添加(set_index
使用append=True
添加到现有的多索引中),然后unstack
添加到列中:
new_df = df.set_index(
df.groupby(level=0).cumcount() + 1, append=True
).unstack()
new_df
:
pid time
1 2 3 4 1 2 3 4
id vid
id1 vis_id1 pid1 pid2 NaN NaN t_0 t_1 NaN NaN
id2 vis_id2 pid1 pid2 pid3 pid4 t_3 t_4 t_5 t_6
要匹配显示的输出,请仅选择所需的列,然后展平多索引:
new_df = df[['pid']].set_index(
df.groupby(level=0).cumcount() + 1, append=True
).unstack()
new_df.columns = [f'step{i}' for i in new_df.columns.get_level_values(1)]
new_df
:
step1 step2 step3 step4
id vid
id1 vis_id1 pid1 pid2 NaN NaN
id2 vis_id2 pid1 pid2 pid3 pid4
安装程序使用:
import pandas as pd
df = pd.DataFrame({
'id': ['id1', 'id1', 'id2', 'id2', 'id2', 'id2'],
'vid': ['vis_id1', 'vis_id1', 'vis_id2', 'vis_id2', 'vis_id2', 'vis_id2'],
'pid': ['pid1', 'pid2', 'pid1', 'pid2', 'pid3', 'pid4'],
'time': ['t_0', 't_1', 't_3', 't_4', 't_5', 't_6']
}).set_index(['id', 'vid'])
相关阅读Pandas Groupby / List to Multiple Rows
这篇关于将多索引DF的行转置为列的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
沃梦达教程
本文标题为:将多索引DF的行转置为列
基础教程推荐
猜你喜欢
- 如何将RPC与Volttron配合使用 2022-09-21
- 使用工作区API导入方法导入数据库笔记本(动态内 2022-09-21
- 获取多索引中某个级别的最后一个元素 2022-09-22
- 如何在hdf5文件的多个组之间拆分数据? 2022-09-21
- 从顶点坐标创建三角网格 2022-09-21
- 如何防止Groupby超越指数? 2022-09-22
- 在 pandas 中使用带有多重索引的.loc 2022-09-22
- Python h5py-为什么我收到广播错误? 2022-09-21
- 在OpenCV中放大后,Python会捕捉图像的特定部分 2022-09-22
- 跟在带量词的前瞻后面有什么作用? 2022-09-22