Null Importance,和很久之前介绍过的Boruta一样,是一种专门针对树模型的特征选择方法,用来解决树模型中特征重要性并不能真实反映特征与标签的真实关系的问题。最近在一些特征选择的问题上用到了它,效果还不错,并且速度和内存占用上比Bortuta要优秀很多。 # 算法思想 Null Importance的核心思想是输出两种特征重要性,一种是实际的特征重要性,另一种是打乱标签训练得到的null importance,然后使用后者对前者做一个修正,以得到真实的特征重要性。
具体步骤:
2022w微信大数据挑战赛Top方案总结
为什么回归任务不能用Dropout
最近在做一个nlp的回归任务,所以直接套用之前做分类问题的的代码,仅仅修改了下损失函数而已,结果发现验证损失一直在震荡,不收敛,但是别人的代码loss却能够稳定下降,最终下降到0.1左右,而我的只能却一直飘,最终只下降到0.14,如下图:
Transformers的性能优化方法
前言
时间序列的区间预测/概率预测
一般我们做时间序列预测都是做点预测(point forecasting),很少会去考虑区间预测(interval forecasting),或者概率预测(probabilistic forecasting),但实际上区间预测也是很重要的,具体来说有这三方面的作用: