pythonFearturetools三个基本概念
python中Fearturetools三个基本概念
常规特征工程学方法通过人工构造特征,是一个繁琐、费时且易出错的过程。自动化特征工程是一个通过诸如Fearturetools之类的工具,从一组相关数据表中自动产生有用特征的过程。与手工生成的特征相比,该方法效率更高,重复性更高,并能更快的建立模型。
一、Featuretools是什么?
Featuretools是一个用于执行自动化特征工程的开源库。
二、Featuretools基本的三个概念
1、FeaturePrimitives(特征基元):
生成特征的常用方法,分为聚合、转换的方式。
特征加工方法
importfeaturetoolsasft
ft.list_primitives()
2、Entity(实体)
可以被看作类似PandasDataFrame,多个实体的集合称为Entityset。
实体间可以根据关联键添加关联关系Relationship。
3、dfs(深度特征合成)
是从多个数据集创建新特征的过程,可以通过设置搜索的深度(max_depth)来控制所特征生成的复杂性。
以上就是python中Fearturetools三个基本概念,希望能对大家有所帮助。更多Python学习教程请关注IT培训机构:开发教育。
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,本着为中国教育事业出一份力,发布内容不收取任何费用也不接任何广告!)