Pandas与NumPy的区别
Pandas 是一个用Python语言编写的开源、BSD授权的库。Pandas提供高性能、快速、易于使用的数据结构和数据分析工具,用于处理数字数据和时间序列。Pandas是建立在numpy库上的,并以Python、Cython和C等语言编写。在pandas中,我们可以从各种文件格式导入数据,如JSON、SQL、Microsoft Excel等。
示例:
# Importing pandas library
import pandas as pd
# Creating and initializing a nested list
age = [['Aman', 95.5, "Male"], ['Sunny', 65.7, "Female"],
['Monty', 85.1, "Male"], ['toni', 75.4, "Male"]]
# Creating a pandas dataframe
df = pd.DataFrame(age, columns=['Name', 'Marks', 'Gender'])
# Printing dataframe
df
输出:
Numpy :它是python的基本库,用于进行科学计算。它提供了高性能的多维数组和处理这些数组的工具。一个n umpy数组是一个由正整数的元组索引的数值(同一类型)的网格,numpy数组速度快,易于理解,并给用户提供了跨数组进行计算的权利。
示例:
# Importing Numpy package
import numpy as np
# Creating a 3-D numpy array using np.array()
org_array = np.array([[23, 46, 85],
[43, 56, 99],
[11, 34, 55]])
# Printing the Numpy array
print(org_array)
输出:
a [23 46 85]
[43 56 99]
[11 34 55]]
Pandas与NumPy之间的差异表如下。
PANDAS | NUMPY |
---|---|
当我们必须处理表格数据时,我们更喜欢p_andas_模块。 | 当我们需要处理数字数据时,我们更喜欢n_umpy_模块。 |
pandas的强大工具是数据框和系列。 | 而numpy的强大工具是数组。 |
Pandas会消耗更多的内存。 | Numpy的内存效率高。 |
当行数为500K或更多时,Pandas具有更好的性能。 | 当行数为50K或更少时,Numpy有更好的性能。 |
与numpy数组相比,pandas数组的索引非常慢。 | numpy数组的索引是非常快的。 |
Pandas提供了一个名为DataFrame的have2d表对象。 | Numpy能够提供多维数组。 |
它由Wes McKinney开发,于2008年发布。 | 它由Travis Oliphant开发,于2005年发布。 |
它被用于许多组织,如Kaidee、Trivago、Abeja公司。,以及更多。 | 它正在被用于沃尔玛Tokopedia、Instacart等组织中。 |
它具有较高的行业应用。 | 它的行业应用较低。 |