Pandas DataFrame的处理时间

Pandas DataFrame的处理时间

在本文中,我们将学习使用内置Pandas库生成和处理不同时间戳。我们还使用numpy模块生成和修改时间戳生成所需的数据库。

首选IDE:Jupyter notebook

在开始这个教程之前,我们必须安装Pandas和numpy库。对于这个问题,Jupyter Notebook是测试和运行代码的最佳地点。为了安装Pandas,我们必须运行以下命令。

>>> pip install pandas

如果我们运行此命令,则所有依赖项都会自动安装。 完成后,我们必须重新启动内核以查看更改。

在安装所有依赖项后,我们可以将Pandas导入为“p”。

这里我们调用数据框构造函数并使用日期参数从4个周期和2小时的频率初始化数据库。通过指定键“时间”,我们显示数据库。

>>> pip install pandas
>>> import pandas as p
>>> data_struct = p.DataFrame()
>>> data_struct['time'] = p.date_range('14/7/2019', periods = 4, freq='3H')
>>> print(data_struct['time'])
0 2019-07-14 00:00:00
1 2019-07-14 03:00:00
2 2019-07-14 06:00:00
3 2019-07-14 09:00:00
Name: time, dtype: datetime64[ns]

通过使用.dt.,可以提取特征。通过使用head()方法,我们可以显示来自数据库的所有行。

>>> data_struct['year'] = data_struct['time'].dt.year
>>> data_struct.head(4)
   time
0 2019-07-14 00:00:00 2019
1 2019-07-14 03:00:00 2019
2 2019-07-14 06:00:00 2019
3 2019-07-14 09:00:00 2019

在此处,我们实现了numpy模块中的.array()函数来创建时间字符串。通过使用Pandas库中的.to_datetime()方法,这些字符串将转换为DateTime。

>>> import numpy as n
>>> dt_timestring = n.array(['14-07-2019 07:26 AM', '13-07-2019 11:01 PM'])
>>> timestamps = [p.to_datetime(date, format ="%d-%m-%Y %I:%M %p", errors ="coerce") for date in dt_timestring]
>>> print(timestamps)
[Timestamp('2019-07-14 07:26:00'), Timestamp('2019-07-13 23:01:00')]

在这里,我们正在使用日期作为索引数据库,这意味着“日期”字段将首先显示。通过使用.set_index()方法。

>>> data_struct1 = p.DataFrame()
>>> data_struct1['date'] = p.date_range('18/07/2019', periods = 5, freq ='2H')
>>> data_struct1= data_struct1.set_index(data_struct1['date'])
>>> print(data_struct1.head(5))
   date
date
2019-07-18 00:00:00 2019-07-18 00:00:00
2019-07-18 02:00:00 2019-07-18 02:00:00
2019-07-18 04:00:00 2019-07-18 04:00:00
2019-07-18 06:00:00 2019-07-18 06:00:00
2019-07-18 08:00:00 2019-07-18 08:00:00

如果我们只想显示数据库中的特定数据集,那么我们可以按以下内容实施命令 –

>>> data_struct2 = p.DataFrame()
>>> data_struct2['date'] = p.date_range('17/07/2019', periods =3, freq ='4H')
>>> print(data_struct2.head(5))
   date
0 2019-07-17 00:00:00
1 2019-07-17 04:00:00
2 2019-07-17 08:00:00
>>> inp = data_struct2[(data_struct2['date'] > '2019-07-17 04:00:00')]
>>> print(inp)
   date
2 2019-07-17 08:00:00

结论

在本文中,我们学习了如何在各种方式中打包和解包元组。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程