开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

TanJ@FRM · 2024年06月15日

决策树

基础课讲义467页。

决策树每个节点的选择,都应该是使用使信息增益最大的input对吗?信息增益最大,对应的应该是使用这个input分类后的信息熵或基尼系数最小吧?为什么老师说是最大呢?

另外,再计算各input的信息增益时,被减数那一项应该都是相同的吧?是不是直接看信息熵或基尼系数就好了,选择最小的信息熵或基尼系数?

1 个答案

pzqa27 · 2024年06月17日

嗨,努力学习的PZer你好:


决策树每个节点的选择,都应该是使用使信息增益最大的input对吗?信息增益最大,对应的应该是使用这个input分类后的信息熵或基尼系数最小吧?为什么老师说是最大呢?

我听了下视频,何老师说的是”选择的threshold 应该是最大化information gain的,也就是是基尼系数最小“这里好像没什么问题。

另外,再计算各input的信息增益时,被减数那一项应该都是相同的吧?是不是直接看信息熵或基尼系数就好了,选择最小的信息熵或基尼系数?

推荐算一下base Gini或者base 熵,因为如果不算base的话,没法确定是熵增还是熵减。

----------------------------------------------
努力的时光都是限量版,加油!

  • 1

    回答
  • 0

    关注
  • 80

    浏览
相关问题