开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

138****3648 · 2024年05月01日

TF-IDF=TF*IDF 的逻辑是什么,两个指标的差等于两个指标的乘积?

 04:55 (1.5X) 

如题,麻烦老师解答



1 个答案

Tina_品职助教 · 2024年05月04日

嗨,从没放弃的小努力你好:


TF-IDF算法是一个用于信息检索和文本挖掘的常用加权技术。其主要思想是,如果某个词语在一篇文章中频繁出现而在其他文章中很少见,那么它可能就很重要,应该被赋予高权重。这里的“TF”指的是词频(Term Frequency),即某个词在文档中出现的频率;“IDF”指的是逆文档频率(Inverse Document Frequency),用来衡量词语的一般重要性。

TF-IDF值计算公式是:TF-IDF=TF×IDF

TF-IDF=TF×IDF

  • TF(词频)是指某个词在特定文档中出现的次数除以该文档的总词数。
  • IDF(逆文档频率)是对词语普遍重要性的度量,计算公式是取对数后的文档总数除以包含该词语的文档数。

因此,TF-IDF是一个名称,计算方式是两个指标的乘积

----------------------------------------------
虽然现在很辛苦,但努力过的感觉真的很好,加油!

  • 1

    回答
  • 0

    关注
  • 100

    浏览
相关问题