在Pandas DataFrame的每组中获取最上面的N条记录
首先,pandas DataFrame以表的形式存储数据。在某些情况下,我们需要根据一些条件从DataFrame中检索数据。例如,如果我们想获得DataFrame中每组的前N条记录。我们创建DataFrame并使用下面提到的方法。
获取每组中最重要的N条记录
首先,我们在Python中创建了一个pandasDataFrame。
输出:
使用pandas的Groupby()函数对列进行分组
现在,我们将得到 “变量 “列中每一组的最上面的N个值。这里reset_index()被用来根据数据的分组提供一个新的索引。head()用于从顶部获得最重要的N个值。
例子1:假设N=2的值
输出:
例子2:现在,假设N=4的值
输出:
使用pandas的nlargest()函数对列进行分组
现在,我们将得到 “变量 “列中每组的最上面的N个值。这里nlargest()函数被用来获取指定列中最大的N个值。
输出: