Pandas数据清洗之替换字符串

admin
2022-09-19 / 0 评论 / 3 阅读 / 正在检测是否收录...

1.replace:将指定位置的字符,替换为给定的字符串

df['身高'] = df['身高'].str.replace(':','-')
df['身高'] = df['身高'].apply(lambda x: x.replace(':','-'))

2.findall使用正则表达式,做数据清洗,真的很香!

df["身高"]
df["身高"].str.findall("[a-zA-Z]+")

l88unfk1.png

3.split方法+expand参数:搭配join方法功能很强大

# 普通用法
df["身高"].str.split(":")
# split方法,搭配expand参数
df[["身高描述","final身高"]] = df["身高"].str.split(":",expand=True)
df
# split方法搭配join方法
df["身高"].str.split(":").str.join("?"*5)

11

3.strip/rstrip/lstrip:去除空白符、换行符

df["姓名"] = df["姓名"].str.strip()

#Python rstrip() 删除 string 字符串末尾的指定字符(默认为空格)。
#Python lstrip() 删除 string 字符串头部的指定字符(默认为空格)。
0

评论 (0)

取消