按行拆分Pandas数据框架

按行拆分Pandas数据框架

我们可以尝试不同的方法来拆分Dataframe,以获得理想的结果。让我们举一个钻石数据集的例子。

# importing libraries
import seaborn as sns
import pandas as pd
import numpy as np
 
# data needs not to be downloaded separately
df  = sns.load_dataset('diamonds')
df.head()

输出:

按行拆分Pandas数据框架

方法1:按行索引分割Pandas数据框架
在下面的代码中,数据帧被分为两部分,前1000行和剩余行。我们可以看到新形成的数据框架的形状是给定代码的输出。

# splitting dataframe by row index
df_1 = df.iloc[:1000,:]
df_2 = df.iloc[1000:,:]
print("Shape of new dataframes - {} , {}".format(df_1.shape, df_2.shape))

输出:

按行拆分Pandas数据框架

方法2:通过由独特的列值形成的组来分割Pandas数据框架
在这里,我们将首先通过列值 “颜色 “对数据进行分组。新形成的数据框架由颜色=”E “的分组数据组成。

# splitting dataframe by groups
# grouping by particular dataframe column
grouped = df.groupby(df.color)
df_new = grouped.get_group("E")
df_new

输出:

按行拆分Pandas数据框架

方法3:将Pandas数据框架分割成预定大小的块
在上面的代码中,我们可以看到,我们已经形成了一个新的数据集,其大小为0.6,即总行数的60%(或数据集的长度),现在由32364行组成。这些行是随机选择的。

# splitting dataframe in a particular size
df_split = df.sample(frac=0.6,random_state=200)
df_split.reset_index()

输出:

按行拆分Pandas数据框架

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程