统计excel中非空的数量

统计excel中非空的数量

统计excel中非空的数量

在日常工作中,经常会需要对Excel表格进行统计分析。其中,一个常见的需求是统计表格中非空单元格的数量。本文将介绍如何使用Python和pandas库来实现这一功能。

准备工作

在开始之前,需要安装pandas库。如果尚未安装,可使用以下命令进行安装:

pip install pandas

接下来,准备一个示例的Excel表格以供演示。假设我们有一个名为data.xlsx的Excel文件,内容如下:

|  A  |  B  |  C  |
|-----|-----|-----|
| 1   |     | 3   |
|     | 2   |     |
| 4   | 5   | 6   |
| 7   |     | 8   |

读取Excel数据

首先,我们需要读取Excel文件中的数据。可以使用pandas的read_excel函数来实现:

import pandas as pd

df = pd.read_excel('data.xlsx')
print(df)

运行以上代码,将输出Excel表格的内容:

    A    B    C
0  1.0  NaN  3.0
1  NaN  2.0  NaN
2  4.0  5.0  6.0
3  7.0  NaN  8.0

统计非空数量

接下来,我们可以使用pandas的notnull函数来统计每一列非空单元格的数量。具体代码如下:

not_null_count = df.notnull().sum()
print(not_null_count)

运行以上代码,将输出每一列的非空单元格数量:

A    3
B    2
C    3
dtype: int64

可以看到,列A有3个非空单元格,列B有2个非空单元格,列C有3个非空单元格。

统计总数

如果需要统计整个表格的非空单元格数量,可以使用sum函数来计算所有列的非空数量之和:

total_not_null_count = df.notnull().sum().sum()
print(total_not_null_count)

运行以上代码,将输出整个表格的非空单元格数量:

8

结语

通过以上步骤,我们成功实现了统计Excel表格中非空单元格数量的功能。使用pandas库可以方便地对Excel数据进行处理和分析,为日常工作提供了很大的便利。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程