如何使用Pandas从Excel文件列中提取时间数据
在这些文章中,我们将讨论如何使用Pandas从Excel文件列中提取时间数据。假设我们的Excel文件看起来像下面给出的图片,那么我们必须从Excel表的列中提取时间,并将其存储到一个新的Dataframe列。
步骤:
- 导入所需的模块。
- 从Excel文件导入数据。
- 为商店的提取时间多做一列。
- 设置索引,用于搜索提取列。
- 定义时间格式的模式(HH: MM: SS)。
- 搜索时间并将其分配给数据框架中的相应列。
让我们来看看一步一步的实施情况。
第1步:导入所需的模块并从Excel文件中读取数据。
输出:
步骤2:制作一个额外的列来存储时间数据。
输出:
第3步:设置搜索的索引
输出:
第4步:定义时间的正则表达式(regex)。
时间HH/MM/SS格式的Regex。
步骤5:搜索时间并将其分配给数据框架中的相应列。
为了在一个字符串中使用regex搜索时间,我们使用re库的re.search()函数。
输出:
完整代码:
输出:
注意:在运行这个程序之前,确保你已经在你的Python环境中安装了xlrd库。