Pandas和NumPy的区别

Pandas和NumPy的区别

Pandas

Pandas是一个用Python语言编写的开源、BSD许可的库。Pandas提供高性能、快速、易于使用的数据结构和数据分析工具,用于处理数字数据和时间序列。Pandas建立在numpy库上,用Python、Cython和C语言编写。在Pandas中,我们可以从各种文件格式导入数据,如JSON、SQL、Microsoft Excel等。

例子:

# Importing pandas library
import pandas as pd

# Creating and initializing a nested list
age = [['Andy', 95.5, "男"], ['杰伦', 65.7, "女"],['周杨', 85.1, "男"], ['张三', 75.4, "男"]]

# Creating a pandas dataframe
df = pd.DataFrame(age, columns=['姓名', '分数', '性别'])

# Printing dataframe
df
Python

Numpy

Numpy是python的基本库,用于进行科学计算。它提供了高性能的多维数组和处理这些数组的工具。numpy数组是一个由正整数的元组索引的数值(同一类型)的网格,numpy数组速度快,容易理解,并给予用户在数组间进行计算的权利。

例子:

# Importing Numpy package
import numpy as np

# Creating a 3-D numpy array using np.array()
org_array = np.array([[123, 426, 385],
                    [243, 256, 939],
                    [131, 334, 552]])

# Printing the Numpy array
print(org_array)
Python

Pandas与NumPy之间的差异表如下。

Pandas Numpy
当需要处理表格数据时,更喜欢pandas模块。 当需要处理数字数据时,更喜欢numpy模块。
pandas的强大工具是数据框架和系列。 而numpy的强大工具是数组。
Pandas会消耗更多的内存。 Numpy的内存是高效的。
当行数为500K或更多时,Pandas有更好的性能。 当行数为50K或更少时,Numpy有更好的性能。
与numpy数组相比,pandas数组的索引非常慢。 Numpy数组的索引是非常快的。
Pandas提供了一个名为DataFrame的have2d表对象。 Numpy能够提供多维数组。
Pandas是由Wes McKinney开发的,于2008年发布。 Numpy是由Travis Oliphant开发的,于2005年发布。
Pandas被用于很多组织,如Kaidee、Trivago、Abeja公司。,以及更多。 Numpy正在被用于像沃尔玛Tokopedia、Instacart等组织中。
Pandas有一个较高的行业应用。 Numpy有一个较低的行业应用。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册