Python reshape()函数在Pandas DataFrame中重新组织数据
我们可以通过对特定列进行分类来轻松重新组织数据。在这里,我们将对“Result”列进行分类,即将Pass和Fail值转换成数字形式。
导入所需的库−
import pandas as pd
创建一个包含2列的DataFrame −
dataFrame = pd.DataFrame(
{
"Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
}
)
使用map()函数重新组织数据,将‘Pass’设置为1,将‘Fail’设置为0−
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })
示例
以下是代码−
import pandas as pd
# 创建DataFrame
dataFrame = pd.DataFrame(
{
"Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
}
)
print"DataFrame ...\n",dataFrame
# 重新组织数据为数字形式
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })
print"\n重新组织后的DataFrame ...\n",dataFrame
输出
这将生成以下输出
DataFrame ...
Result Student
0 Pass Jack
1 Fail Robin
2 Fail Ted
3 Pass Scarlett
4 Pass Kat
重新组织后的DataFrame ...
Result Student
0 1 Jack
1 0 Robin
2 0 Ted
3 1 Scarlett
4 1 Kat