之前老师上课的时候有说过CART里面的那些node里面的cutoff value是hyperparameter,所以为什么A不对
星星_品职助教 · 2021年04月29日
同学你好,
initial hyperparameter在CART算法中指的是设置“tree”的最大高度,节点的最多数量,每个节点最少包含的数据量这些,这当中并不包括cutoff value,后者是跟着feature(用来分类的特征值)走的。即有多少个features,就要有多少个cutoff value。而不是简单粗暴就设定一个,然后整个模型都遵循这个参数的法则来运算。
对于A选项而言,CART是可以设置超参数的(例如以上那些),但是这不是CART算法可以使用的必须前提条件(requirement)。只有在当建模者认为CART有可能产生过度拟合问题时,才可能选择用加入这些超参数的方式来降低overfitting。
其次,加入超参数并不是降低overfitting唯一的选项。也可以通过在建立完CART后,对这个算法进行“剪枝”(pruning)处理来改善overfitting,这同样不需要超参数的参与。
所以Statement I中对于超参数“no requirement”的描述是正确的。