catboost特征重要性feature importance计算逻辑深度揭秘(全网最全,硬核收藏)
时间:2024-05-04 07:30:47 来源:网络cs 作者:付梓 栏目:建站工具 阅读:
InternalInteraction内在交互
模型中使用的每对特征的特征交互强度的值。在内部,模型使用特征组合作为单独的特征。模型中使用的所有特征组合都单独列出。例如,如果模型包含名为F1的特征和特征的组合{F2,F3},则F1和特征组合{F2、F3}之间的交互将列在输出文件中。
下图是官方释义
catboost有着复杂且智能的变量重要性计算方法,那我们到底该用哪一种合适呢?
为了更好地理解这些差异,下面是我们讨论的所有方法的结果:
CatBoost功能IMP.的结果预测-报告来自经典“成人”人口普查数据集,人们是否会有超过5万美元的收入(使用日志丢失)。
从上面的图中,我们可以看到,大多数方法在顶级特性上是一致的。看起来lossFunctionChange最接近shap(更可靠)。然而,直接比较这些方法是不公平的,因为预测值变化是基于训练数据,而其他所有方法都是基于试验数据。
我们还应该看到运行所有这些程序所需的时间:shap最慢,PredictionValuesChange最快
参考链接
https://catboost.ai/en/docs/concepts/fstr#regular-feature-importance;
https://catboost.ai/en/docs/concepts/ostr;
更多关于catboost算法建模知识的同学可以收藏课程《python风控建模实战lendingClub》。
我们公司提供一对一机器学习模型定制服务,提供公司正规发票,如果你需要建模项目定制服务,留言联系。
本文链接:https://www.kjpai.cn/news/2024-05-04/164607.html,文章来源:网络cs,作者:付梓,版权归作者所有,如需转载请注明来源和作者,否则将追究法律责任!
上一篇:澎湃os绕社区解锁bl实践
下一篇:返回列表