开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

Olivia Zhang · 2024年01月28日

No.PZ2022120201000002 (问答题)

No.PZ2022120201000002 (问答题)

来源: 原版书

What type of machine-learning algorithm could


b. A bank use to separate its savers into groups given information on their age, gender, and income?

为什么这道题的答案说, 数据是unlabeled,因此适用于unsupervised machine learning方法?数据不是有着 age,gender ,income这样的标签吗?


所以,可否举例说明什么是labeled 以及什么是unlabeled?

1 个答案

pzqa39 · 2024年01月29日

嗨,爱思考的PZer你好:


这道题我们可以这样去理解:银行利用储户的年龄、性别和收入信息将其分成不同的群体,但这些仅仅是客户特征,并没有被用作明确的“标签”来定义客户的类别,比如说客户类型、风险等级、产品偏好等。要区分“标记数据”和“未标记数据”,关键在于是否存在用于明确分类或描述数据点的额外标签。如果这道题中,银行后续为这些群体定义了特定的分类或标签(例如将某个群体标记为“高价值客户”),那么这个就算是label.


依然用银行来举例说明:

申请人A(年龄:35岁,年收入:$40,000,信用卡申请:批准),这里的“信用卡申请:批准/未批准”是一个标记(label)。它为数据点(在这个例子中是信用卡申请)提供了一个明确的分类或状态。

但是如果我们只是给到申请人的年龄和年收入这样的信息,要求算法根据信息自行定义类别,并没有给出我们需要通过客户信息把客户定义成什么类别,那就是unlabel。

----------------------------------------------
努力的时光都是限量版,加油!

  • 1

    回答
  • 0

    关注
  • 140

    浏览
相关问题