开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

亲爱的人儿 · 2022年10月18日

Classification and Regression Tree


问题如下:

  1. 关于statement 1,CART 中single feature, cutoff value这些不是需要认为决定的吗?这些不属于hyperparameter?
  2. 关于statement 2,cutoff value不是需要最大程度上把类别划分出来吗?这个不属于similarity(distance) measure?
  3. 关于statement 3, 讲义中KNN是有图可以表示的,这里不是说明KNN也可以vidual explanation?
3 个答案

星星_品职助教 · 2022年10月20日

回复问题3:KNN并不像CART可以画出二叉树,算法本身没有图像表示。讲义中的图是对KNN的原理做阐述,而不是每次用KNN都要画图。

星星_品职助教 · 2022年10月19日

回复问题2:算距离是KNN的方法,距离需要通过公式计算(CFA中不会考察具体的距离或者计算)。cutoff value是一个数值,不是distance measure。

星星_品职助教 · 2022年10月19日

同学你好,

回复问题1:

initial hyperparameter在CART算法中指的是设置“tree”的最大高度,节点的最多数量,每个节点最少包含的数据量这些,这当中并不包括cutoff value,后者是跟着feature(用来分类的特征值)走的。即有多少个features,就要有多少个cutoff value。

而不是简单粗暴就设定一个,然后整个模型都遵循这个参数的法则来运算。

对于A选项而言,CART是可以设置超参数的(例如以上那些),但是这不是CART算法可以使用的必须前提条件(requirement)。只有在当建模者认为CART有可能产生过度拟合问题时,才可能选择用加入这些超参数的方式来降低overfitting。

  • 3

    回答
  • 0

    关注
  • 222

    浏览
相关问题