老师好,
请问根据问题“recollection about the preparation fo the textual data”,怎么看得出问的是text cleansing而不是test wrangling?何老师说因为问的是text cleansing所以选A,但是我看不出为啥问的是text cleansing.
谢谢老师
星星_品职助教 · 2021年11月04日
同学你好,
需要掌握一下结构框架,对于textual data:
一、Text Preparation(Cleansing):四个“remove”
1) remove html tags;
2)remove punctuations;
3)remove numbers;
4)remove white space
二、Text Wrangling(preprocessing):
1) lowercasing
2)stop words
3)stemming
4) lemmatization
所以看到题干中“preparation”描述,直接选择htiml tag,punctuation,number中的一项就可以。不能选择preprocessing中的stop words