跨境派

跨境派

跨境派,专注跨境行业新闻资讯、跨境电商知识分享!

当前位置:首页 > 工具系统 > 建站工具 > catboost特征重要性feature importance计算逻辑深度揭秘(全网最全,硬核收藏)

catboost特征重要性feature importance计算逻辑深度揭秘(全网最全,硬核收藏)

时间:2024-05-04 07:30:47 来源:网络cs 作者:付梓 栏目:建站工具 阅读:

标签: 深度  收藏  逻辑 

InternalInteraction内在交互

模型中使用的每对特征的特征交互强度的值。在内部,模型使用特征组合作为单独的特征。模型中使用的所有特征组合都单独列出。例如,如果模型包含名为F1的特征和特征的组合{F2,F3},则F1和特征组合{F2、F3}之间的交互将列在输出文件中。

下图是官方释义

图片

catboost有着复杂且智能的变量重要性计算方法,那我们到底该用哪一种合适呢?

为了更好地理解这些差异,下面是我们讨论的所有方法的结果:
 

图片

图片

CatBoost功能IMP.的结果预测-报告来自经典“成人”人口普查数据集,人们是否会有超过5万美元的收入(使用日志丢失)。

图片

图片

从上面的图中,我们可以看到,大多数方法在顶级特性上是一致的。看起来lossFunctionChange最接近shap(更可靠)。然而,直接比较这些方法是不公平的,因为预测值变化是基于训练数据,而其他所有方法都是基于试验数据。

我们还应该看到运行所有这些程序所需的时间:shap最慢,PredictionValuesChange最快

图片

参考链接

https://catboost.ai/en/docs/concepts/fstr#regular-feature-importance;

https://catboost.ai/en/docs/concepts/ostr;

更多关于catboost算法建模知识的同学可以收藏课程《python风控建模实战lendingClub》。

我们公司提供一对一机器学习模型定制服务,提供公司正规发票,如果你需要建模项目定制服务,留言联系。

本文链接:https://www.kjpai.cn/news/2024-05-04/164607.html,文章来源:网络cs,作者:付梓,版权归作者所有,如需转载请注明来源和作者,否则将追究法律责任!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

文章评论