0%

线性回归作为一个非常经典的方法,被广泛应用于计量领域,用来解释变量对y的影响,但是在机器学习领域用纯粹的线性回归来做预测的好像就很少了,因为预测效果不怎么样,因此本文将对线性回归的两种改进方法做一个总结。

阅读全文 »

最近偶然接触到一种回归算法,叫做前向分布回归(Forward Stagewise Regression),注意这不是那个向前逐步回归(Forward stepwise regression),stepwise和stagewise,还是有区别的,网上关于他的介绍非常少,中文社区基本就没怎么看到了,就顺手写一下吧,算法的思想来源于boosting,理解这个也有助于之后对各种树模型的boosting算法的学习。

阅读全文 »

最近发现自己的输出能力实在太菜了,写东西经常要憋很久才憋出来,而且写的东西逻辑也不太清楚,所以就想着多写点东西来提升自己的写作能力,同时也加深下自己对于一些问题的理解吧,另外一个原因就是发现自己好多东西都是学完就忘,必须找个平台记录下自己学过的东西!刚好最近有个课程作业,要求爬取58同城上面的厦门二手房信息进行数据分析,就拿这个来小试牛刀吧,预计写两篇,第一篇是爬虫,第二篇是数据分析。

阅读全文 »

前几天美赛出成绩了,有幸能够获得M奖,虽然说在知乎这种人均F奖、M奖的环境下看似乎算不了什么,但是对于我个人而言,和两位队友四天四夜投入所有时间精力来解决一个陌生的问题在我的大学生活中也算是比较珍贵的一段经历吧! 鉴于参赛前参考了很多前辈们的参赛经验帖,受益颇深,因此,我也在此将自己本次参赛的一些心得分享给之后参赛的同学们,但凡能够从某个角度上帮助到某些人,那么我写的这些东西也都是值得的了。 文章提到的资料和我本次参赛的作品均已上传到GitHub,好的正文开始:

阅读全文 »