1.replace:将指定位置的字符,替换为给定的字符串
df['身高'] = df['身高'].str.replace(':','-')
df['身高'] = df['身高'].apply(lambda x: x.replace(':','-'))2.findall使用正则表达式,做数据清洗,真的很香!
df["身高"]
df["身高"].str.findall("[a-zA-Z]+")
3.split方法+expand参数:搭配join方法功能很强大
# 普通用法
df["身高"].str.split(":")
# split方法,搭配expand参数
df[["身高描述","final身高"]] = df["身高"].str.split(":",expand=True)
df
# split方法搭配join方法
df["身高"].str.split(":").str.join("?"*5)
3.strip/rstrip/lstrip:去除空白符、换行符
df["姓名"] = df["姓名"].str.strip()
#Python rstrip() 删除 string 字符串末尾的指定字符(默认为空格)。
#Python lstrip() 删除 string 字符串头部的指定字符(默认为空格)。
评论 (0)