开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

香蕉树上的考拉 · 2019年11月20日

reading 8 big data 课后题3、4

3 题 答案是C ,但我觉得题目写的不明确是第几个row 。IPO date 中26-June-74 是无效数据invalidy error ,November15 2004与其他格式不一致是inconsistency error ,为什么选C不能理解

4题 答案是A ,debt=0,不就相当于是没有数值,是incompletness error为什么选A 不一致 

1 个答案
已采纳答案

星星_品职助教 · 2019年11月20日

同学你好,

这两道题都是概念的理解问题。

第3题:invalidity error指得是数据明显偏离应有的范围,例如一个人几百岁,或者身高十几米。而26-Jun-74大概率指得是1974.6.26,这是一个正常的范围。之所以只是“大概率”是1974年,还是因为是格式不统一,所以没说明白到底是哪一年。所以这个问题的核心是non-uniformity。

如果要考察数据无效,则首先这一行的时间数据格式会统一,假设全都是月-日-年的格式,而这一项会显示为例如26-Jun-1674。

第4题:“0”也是一个数值,一家公司的债务是0是理论上完全可行的。而incompleteness error指得是空值(什么都没有),或者NA。这道题主要问题就是由于有利息的存在,所以债务是0很可能是个错误的输入值,也就是利息和债务这两列体现出了不一致。 

这几个错误一开始的时候不大好区分,可以按照老师上课讲的,记忆一下例子。加油

香蕉树上的考拉 · 2019年11月20日

第3题novermber 15我可以解释成与其他不一致的错误。inconsistent error。也可以解释成与其他格式不一致nonuniform error。 我仔细听老师讲inconsistent error 的一个例子就是日期与其他不一样。

星星_品职助教 · 2019年11月20日

inconsistency error指的是数据中出现了矛盾的情况。而non-uniformity指的是数据的格式不统一。前者的例子是某某女士的性别却显示为男,或者第四题那样明明有利息,但债务却显示为0。第三题Nov 15并没有和其他数据不一致冲突的地方。所以就不能解释为数据不一致~

  • 1

    回答
  • 0

    关注
  • 288

    浏览
相关问题