Pandas和NumPy的区别
Pandas
Pandas是一个用Python语言编写的开源、BSD许可的库。Pandas提供高性能、快速、易于使用的数据结构和数据分析工具,用于处理数字数据和时间序列。Pandas建立在numpy库上,用Python、Cython和C语言编写。在Pandas中,我们可以从各种文件格式导入数据,如JSON、SQL、Microsoft Excel等。
例子:
# Importing pandas library
import pandas as pd
# Creating and initializing a nested list
age = [['Andy', 95.5, "男"], ['杰伦', 65.7, "女"],['周杨', 85.1, "男"], ['张三', 75.4, "男"]]
# Creating a pandas dataframe
df = pd.DataFrame(age, columns=['姓名', '分数', '性别'])
# Printing dataframe
df
Numpy
Numpy是python的基本库,用于进行科学计算。它提供了高性能的多维数组和处理这些数组的工具。numpy数组是一个由正整数的元组索引的数值(同一类型)的网格,numpy数组速度快,容易理解,并给予用户在数组间进行计算的权利。
例子:
# Importing Numpy package
import numpy as np
# Creating a 3-D numpy array using np.array()
org_array = np.array([[123, 426, 385],
[243, 256, 939],
[131, 334, 552]])
# Printing the Numpy array
print(org_array)
Pandas与NumPy之间的差异表如下。
Pandas | Numpy |
---|---|
当需要处理表格数据时,更喜欢pandas模块。 | 当需要处理数字数据时,更喜欢numpy模块。 |
pandas的强大工具是数据框架和系列。 | 而numpy的强大工具是数组。 |
Pandas会消耗更多的内存。 | Numpy的内存是高效的。 |
当行数为500K或更多时,Pandas有更好的性能。 | 当行数为50K或更少时,Numpy有更好的性能。 |
与numpy数组相比,pandas数组的索引非常慢。 | Numpy数组的索引是非常快的。 |
Pandas提供了一个名为DataFrame的have2d表对象。 | Numpy能够提供多维数组。 |
Pandas是由Wes McKinney开发的,于2008年发布。 | Numpy是由Travis Oliphant开发的,于2005年发布。 |
Pandas被用于很多组织,如Kaidee、Trivago、Abeja公司。,以及更多。 | Numpy正在被用于像沃尔玛Tokopedia、Instacart等组织中。 |
Pandas有一个较高的行业应用。 | Numpy有一个较低的行业应用。 |