在Pandas中,df.resample('W')是一个用于重新采样时间序列数据的方法。它允许你将一个具有日期时间索引的DataFrame或Series对象转换为不同的时间频率。
在df.resample('W')中,参数'W'表示按周进行重采样。这意味着将原始数据按周聚合,并生成一个新的DataFrame或Series对象,其中每个周的数据被聚合为一个单独的数据点。
下面是使用df.resample('W')的一个简单示例:
import pandas as pd
# 创建一个包含日期时间索引的示例DataFrame
data = {'date': pd.date_range('2023-01-01', periods=100, freq='D'),
'value': range(100)}
df = pd.DataFrame(data)
df.set_index('date', inplace=True)
# 按周重新采样数据
resampled_df = df.resample('W').sum()
# 输出重新采样后的DataFrame
print(resampled_df)输出结果将类似于以下内容:
value
date
2023-01-01 21
2023-01-08 56
2023-01-15 77
2023-01-22 105
2023-01-29 133
... ...
2023-04-02 1131
2023-04-09 1168
2023-04-16 1205
2023-04-23 1242
2023-04-30 608
[18 rows x 1 columns]在上述示例中,原始数据按每天的频率生成,然后使用df.resample('W')方法按周重新采样。聚合函数(默认为求和)被应用于每个周的数据,生成了一个新的DataFrame,其中每个周的值是原始数据在该周内的总和。
你可以根据需要使用不同的聚合函数来处理数据,如.sum()、.mean()、.max()、.min()等。此外,你还可以使用.agg()方法对不同的列应用不同的聚合函数。
评论 (0)