Pandas数据清洗之替换字符串

admin

2022-09-19 / 0 评论 / 3 阅读 / 正在检测是否收录...

09/19

1.replace：将指定位置的字符，替换为给定的字符串

df['身高'] = df['身高'].str.replace(':','-')
df['身高'] = df['身高'].apply(lambda x: x.replace(':','-'))

2.findall使用正则表达式，做数据清洗，真的很香！

df["身高"]
df["身高"].str.findall("[a-zA-Z]+")

3.split方法+expand参数：搭配join方法功能很强大

# 普通用法
df["身高"].str.split(":")
# split方法，搭配expand参数
df[["身高描述","final身高"]] = df["身高"].str.split(":",expand=True)
df
# split方法搭配join方法
df["身高"].str.split(":").str.join("?"*5)

3.strip/rstrip/lstrip：去除空白符、换行符

df["姓名"] = df["姓名"].str.strip()

#Python rstrip() 删除 string 字符串末尾的指定字符（默认为空格)。
#Python lstrip() 删除 string 字符串头部的指定字符（默认为空格)。

Pandas数据清洗之替换字符串

评论 (0)