Pandas重新采样时间序列resample

admin
2023-05-12 / 0 评论 / 1 阅读 / 正在检测是否收录...

在Pandas中,df.resample('W')是一个用于重新采样时间序列数据的方法。它允许你将一个具有日期时间索引的DataFrame或Series对象转换为不同的时间频率。

在df.resample('W')中,参数'W'表示按周进行重采样。这意味着将原始数据按周聚合,并生成一个新的DataFrame或Series对象,其中每个周的数据被聚合为一个单独的数据点。

下面是使用df.resample('W')的一个简单示例:

import pandas as pd

# 创建一个包含日期时间索引的示例DataFrame
data = {'date': pd.date_range('2023-01-01', periods=100, freq='D'),
        'value': range(100)}
df = pd.DataFrame(data)
df.set_index('date', inplace=True)

# 按周重新采样数据
resampled_df = df.resample('W').sum()

# 输出重新采样后的DataFrame
print(resampled_df)

输出结果将类似于以下内容:

            value
date             
2023-01-01     21
2023-01-08     56
2023-01-15     77
2023-01-22    105
2023-01-29    133
...           ...
2023-04-02   1131
2023-04-09   1168
2023-04-16   1205
2023-04-23   1242
2023-04-30    608

[18 rows x 1 columns]

在上述示例中,原始数据按每天的频率生成,然后使用df.resample('W')方法按周重新采样。聚合函数(默认为求和)被应用于每个周的数据,生成了一个新的DataFrame,其中每个周的值是原始数据在该周内的总和。

你可以根据需要使用不同的聚合函数来处理数据,如.sum()、.mean()、.max()、.min()等。此外,你还可以使用.agg()方法对不同的列应用不同的聚合函数。

0

评论 (0)

取消