检查Pandas数据框架中的NaN

检查Pandas数据框架中的NaN

NaN是Not A Number的缩写,是表示数据中缺失值的常用方法之一。它是一个特殊的浮点值,不能转换为浮点以外的任何其他类型。

NaN值是数据分析中的一个主要问题。为了获得理想的结果,处理NaN是非常重要的。

检查Pandas数据框架中的NaN

检查Pandas数据框架中的NaN值

Pandas DataFrame中检查NaN的方法如下。

  • 用isnull().values.any()方法检查NaN。
  • 使用isnull().sum()方法计算NaN的数量
  • 使用isnull().values.any()方法检查NaN
  • 使用isnull().sum().sum()方法计算NaN的数量

方法1:使用isnull().values.any()方法

示例:

# importing libraries
import pandas as pd
import numpy as np
 
 
num = {'Integers': [10, 15, 30, 40, 55, np.nan,
                    75, np.nan, 90, 150, np.nan]}
 
# Create the dataframe
df = pd.DataFrame(num, columns=['Integers'])
 
# Applying the method
check_nan = df['Integers'].isnull().values.any()
 
# printing the result
print(check_nan)

输出:

True

我们也可以获得存在NaN值的确切位置。我们可以通过从isnull().values.any()中删除.values.any()来做到这一点。

df['Integers'].isnull()

输出:

0     False
1     False
2     False
3     False
4     False
5      True
6     False
7      True
8     False
9     False
10     True
Name: Integers, dtype: bool

方法2:使用isnull().sum()方法

示例:

# importing libraries
import pandas as pd
import numpy as np
 
 
num = {'Integers': [10, 15, 30, 40, 55, np.nan,
                    75, np.nan, 90, 150, np.nan]}
 
# Create the dataframe
df = pd.DataFrame(num, columns=['Integers'])
 
# applying the method
count_nan = df['Integers'].isnull().sum()
 
# printing the number of values present
# in the column
print('Number of NaN values present: ' + str(count_nan))

输出:

Number of NaN values present: 3

方法3:使用isnull().values.any()方法

示例:

# importing libraries
import pandas as pd
import numpy as np
 
nums = {'Integers_1': [10, 15, 30, 40, 55, np.nan, 75,
                       np.nan, 90, 150, np.nan],
        'Integers_2': [np.nan, 21, 22, 23, np.nan, 24, 25,
                       np.nan, 26, np.nan, np.nan]}
 
# Create the dataframe
df = pd.DataFrame(nums, columns=['Integers_1', 'Integers_2'])
 
# applying the method
nan_in_df = df.isnull().values.any()
 
# Print the dataframe
print(nan_in_df)

输出:

True

要获得NaN值的确切位置,我们可以通过从isnull().values.any()中删除.values.any()来实现。

方法4:使用isnull().sum().sum()方法

示例:

# importing libraries
import pandas as pd
import numpy as np
 
nums = {'Integers_1': [10, 15, 30, 40, 55, np.nan, 75,
                       np.nan, 90, 150, np.nan],
        'Integers_2': [np.nan, 21, 22, 23, np.nan, 24, 25,
                       np.nan, 26, np.nan, np.nan]}
 
# Create the dataframe
df = pd.DataFrame(nums, columns=['Integers_1', 'Integers_2'])
 
# applying the method
nan_in_df = df.isnull().sum().sum()
 
# printing the number of values present in
# the whole dataframe
print('Number of NaN values present: ' + str(nan_in_df))

输出:

Number of NaN values present: 3

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程