百科狗-知识改变命运!

python特征生成中字符类型有哪些?

乐乐2年前 (2023-11-19)阅读数 47#技术干货
文章标签字符

python特征生成中字符类型有截取、字符长度和频次。

一、python特征生成中字符类型

1、截取

python特征生成中字符类型有哪些?

当字符类型的值过多,通常可对字符类型变量做截取,以减少模型过拟合。如具体的家庭住址,可以截取字符串到城市级的粒度。

2、字符长度

统计字符串长度。如转账场景中,转账留言的字数某些程度可以刻画这笔转账的类型。

3、频次

二、python特征类型中字符使用

1、截取第一位字符串

df['I1_0']=df['I1'].map(lambdax:str(x)[:1])

2、字符长度

df['I1_len']=df['I1'].apply(lambdax:len(str(x)))

display(df.head())

3、字符串频次

df['I1'].value_counts()

以上就是python特征生成中字符类型有哪些?希望能对大家有所帮助,更多Python学习教程请关注IT培训机构:开发教育。

内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,本着为中国教育事业出一份力,发布内容不收取任何费用也不接任何广告!)