开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

Bluebiubiu · 2021年02月18日

unstructureddata

如下图

MI是越大越重要,所以要选出

但是TF-IDF是越小代表信息约具有区分性,要选出

为什么会这不同的结论啊

1 个答案

星星_品职助教 · 2021年02月18日

同学你好,

这是从两个不同的维度来做feature selection(选择出重要的features)的方法。

TF-IDF是从requency measures的维度出发的;而MI是自己单独的维度,此时就不需要去考虑frequency了。

这两个方法彼此之间没有可比性的,需要单独,分别记忆一下结论。

  • 1

    回答
  • 0

    关注
  • 328

    浏览
相关问题