如何在Pandas中利用时间序列
python中的pandas库提供了一套标准的时间序列工具和数据算法。通过这一点,我们可以有效地处理非常大的时间序列,并轻松地对不规则和固定频率的时间序列进行切片和切块、聚合和重新采样。
时间序列数据是结构化数据的一种重要形式,被用于金融、经济、生态学等领域。任何在许多时间点上被观察或测量的东西都构成了时间序列。
1.时间戳。这些是时间上的特定时刻
2.固定时期。这将代表诸如5月25日的月份或1999年全年。
DateTime中的模块
- date:该模块用于存储年、月、日格式的日历。
- time:该模块用于获取和显示小时、分钟、秒和微秒格式的时间。
- datetime:该模块用于存储日期和时间。
- Timedelta:该模块用于获取两个日期时间值之间的差异。
以下是描述如何利用pandas库中的时间序列的各种例子:
例子1:显示当前日期和时间。在这个程序中,我们将显示当前的日期和时间。
输出:
例子2:程序从模块中单独显示小时、分钟、秒、月、年、日。
输出:
例子3:两个日期之间的差异。我们可以使用timedelta模块获得小时、天和分钟的差异。
输出:
如果我们想生成时间序列数据,python将支持date_range模块。这将生成给定频率内的日期。它在pandas模块中可用。
语法:
参数:
- start:从开始日期开始的时间。
- end:指定结束日期时间。
- freq:代表一个频率,如小时、分钟或秒。
示例4:在这个程序中,我们可以从2021年1月1日开始,使用date_range方法显示到3月的日期。
输出:
通过使用时间序列作为索引,生成对应日期的数值。
例子5:在这个程序中,我们通过设置日期作为每个值的索引来给日期取值。
输出:
我们可以通过以下方法将数据字符串列转换为日期时间类型。
语法:
示例6:在这个程序中,我们将把字符串数据转换为日期时间类型。
输出:
实例7:在这个程序中,我们要把一些时间序列数据作为索引,进行转换,并验证它们是否相等。
输出:
示例8:程序显示具有DateTime对象的数据框的柱状图。
输出: