Python loc函数用法
在 Pandas 中,loc 函数是一种基于标签的索引方式,用来选择指定行和列的数据。它可以根据行标签和列标签来实现数据的筛选和截取。
语法
DataFrame.loc[row_indexer, column_indexer]
row_indexer
: 行标签或标签列表,用于选择特定的行数据。column_indexer
: 列标签或标签列表,用于选择特定的列数据。
示例数据
首先,让我们创建一个示例数据集来演示 loc 函数的使用。
import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
'Age': [25, 30, 35, 40, 45],
'Gender': ['F', 'M', 'M', 'M', 'F'],
'City': ['NY', 'LA', 'SF', 'CHI', 'BOS']
}
df = pd.DataFrame(data)
df.set_index('Name', inplace=True)
print(df)
输出:
Age Gender City
Name
Alice 25 F NY
Bob 30 M LA
Charlie 35 M SF
David 40 M CHI
Eve 45 F BOS
使用 loc 函数进行数据筛选
选择指定行和列
使用 loc 函数可以通过行标签和列标签来选择指定的数据。
print(df.loc['Bob', 'Age'])
输出:
30
选择多行和多列
我们也可以使用 loc 函数选择多行和多列的数据。
print(df.loc[['Bob', 'Charlie'], ['Age', 'City']])
输出:
Age City
Name
Bob 30 LA
Charlie 35 SF
选择所有行和特定列
如果想选择所有行但只选择特定列,可以使用冒号 :
代表所有行。
print(df.loc[:, 'Age'])
输出:
Name
Alice 25
Bob 30
Charlie 35
David 40
Eve 45
Name: Age, dtype: int64
使用条件筛选
我们还可以结合条件来筛选数据。
print(df.loc[df['Age'] > 35])
输出:
Age Gender City
Name
David 40 M CHI
Eve 45 F BOS
总结
通过本文的介绍,我们学习了如何使用 Pandas 中的 loc 函数来选择指定的行和列数据。loc 函数是一种非常灵活和便捷的数据筛选方法,能够满足我们各种数据分析的需求。在实际应用中,结合 loc 函数和条件筛选可以更加精确地找到我们需要的数据,提高数据处理的效率和准确性。