Pandas数据清洗之删除行、列的方法

admin
2022-09-19 / 0 评论 / 5 阅读 / 正在检测是否收录...

1.删除指定列

df.drop(['推荐花费','搜索花费'],axis=1,inplace=True)

2.删除某列为空的行

df.dropna(axis=0,how='any',subset=['pic_id'],inplace=True)

3.删除符合条件的行、列

#删除某列值的字符串包含某字符串的行
df = df[df['分配内容'].str.contains('系统')]
df.drop(df[<some boolean condition>].index,inplace=True)

#删除A列数值为2的行
df.drop(df.index[df['A'] == 2],inplace=True)

# 删除a行数据为3的列
df.drop(df.columns[df.loc['a'] == 3],axis=1,inplace=True) 

4.删除重复的行

# 删除A、B两列重复的行
df.drop_duplicates(subset=['A','B'],keep='first',inplace=True)

# 删除完全相同的行
data.drop_duplicates(inplace=True)
0

评论 (0)

取消