Python Pandas 与SQL的比较
由于许多潜在的Pandas用户对SQL有一定的了解,所以本页面旨在提供使用pandas执行各种SQL操作的一些示例。
它的 输出 如下所示−
SELECT
在SQL中,使用逗号分隔的列列表进行选择(或使用*选择所有列)-
用Pandas,通过将列名列表传递给DataFrame来进行列选择-
让我们来查看完整的程序−
它的 输出 如下:
不带列名列表调用DataFrame将显示所有列(类似于SQL的*)。
WHERE
在SQL中通过WHERE子句进行过滤。
DataFrames可以通过多种方式进行过滤;其中最直观的方法是使用布尔索引。
让我们来查看完整的程序−
它的 输出 如下:
上面的语句将一系列的True/False对象传递给DataFrame,返回所有为True的行。
GroupBy
这个操作在整个数据集中获取每个组中的记录数。例如,一个查询可以获取性别留下的小费数量。
等价于Pandas中的方法是:
让我们来检查完整的程序 –
它的 输出 如下:
前N行
SQL使用 LIMIT 返回前N行。
熊猫的等效方法如下:
让我们来看下完整示例-
这个 输出 如下−
这些是我们在Pandas库的前几章中学到并进行比较的基本操作。