开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

卢雨晴 · 2023年11月07日

二级数量 大数据分析的问题

二级数量的大数据分析,有两个问题:1、IDF是越大越好,还是越小越好;2、在讲到TF-IDF时,是说越大越好,也就意味着两个指标都是越大,最后整体才越有意义;但单独讲TF(sentense level)时,有讲到太大太小都不好,太大可能是stop word,太小可能是专有名词,最好是居中的。请问应该怎么判断,谢谢。

1 个答案

星星_品职助教 · 2023年11月08日

同学你好,

所有指标都是“太大太小都不好,太大可能是stop word,太小可能是专有名词,最好是居中的”。

IDF和TF-IDF也如此,都是大一些好,但是不能极端的大。具体需要看题目里的要求,如果什么都没说,可以考虑选大的。

  • 1

    回答
  • 0

    关注
  • 154

    浏览
相关问题