开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

参商 · 2024年04月16日

想请问DF IDF都是什么的缩写呀

NO.PZ2023050402000014

问题如下:

下面哪种情况最有可能意味着这个特征很重要?

选项:

A.DF很大 B.IDF很小 C.TF-IDF很大 D.TF很大

解释:

正确答案是C选项。TF-IDF同时越大,说明这个单词只出现在少数几个句子当中(IDF大),而在这少数的这几个句子中这个单词的出现频率还高。所以这种单词往往能代表这个句子的特征,起到区分的作用。

想请问DF IDF都是什么的缩写呀

2 个答案
已采纳答案

Tina_品职助教 · 2024年04月18日

嗨,努力学习的PZer你好:


DF (Document Frequency):文件频率指的是某个词语在文档集合中出现的文档数量。如果一个词在很多文档中都出现过,那么它的DF值就很高。

IDF (Inverse Document Frequency):逆文档频率是一个衡量词语重要性的指标。它是DF的倒数,通常会进行对数转换,以便压缩不同频率的尺度。它的基本思想是:如果一个词语出现在较少的文档中,则认为这个词语具有很好的类别区分能力,因此其IDF值较高;相反,如果一个词语在许多文档中都出现,则其IDF值较低。

TF-IDF (Term Frequency-Inverse Document Frequency)


----------------------------------------------
加油吧,让我们一起遇见更好的自己!

Tina_品职助教 · 2024年04月17日

嗨,努力学习的PZer你好:


同学可以回顾下这页课件,有对DF\IDF的解读

----------------------------------------------
虽然现在很辛苦,但努力过的感觉真的很好,加油!

参商 · 2024年04月17日

这里面没有说DF的全称哇老师