1 Introduction

Test 1

1、单选题:
‎某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?‎
选项:
A: 关联规则发现
B: 聚类
C: 分类
D: 自然语言处理
答案: 【 关联规则发现

2、单选题:
​当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?​
选项:
A: 分类
B: 聚类
C: 关联分析
D: 异常检测
答案: 【 聚类

3、判断题:
‎判断以下行为是否属于数据挖掘任务:根据顾客的职业将顾客进行分组‎
选项:
A: 正确
B: 错误
答案: 【 错误

4、判断题:
‍判断以下行为是否属于数据挖掘任务:根据顾客的购物记录预测顾客感兴趣的商品‍
选项:
A: 正确
B: 错误
答案: 【 正确

5、判断题:
​判断以下行为是否属于数据挖掘任务:监测患者的心率是否异常‌
选项:
A: 正确
B: 错误
答案: 【 正确

6、判断题:
‏判断以下行为是否属于数据挖掘任务:提取声波的频率‏
选项:
A: 正确
B: 错误
答案: 【 错误

7、判断题:
​判断以下行为是否属于数据挖掘任务:预测掷骰子的结果‎
选项:
A: 正确
B: 错误
答案: 【 错误

8、填空题:
数据挖掘是从大量数据中挖掘重要、隐含的、以前未知、______的模式或知识。‏‎‏
答案: 【 潜在有用

9、填空题:
‌从数据仓库的角度可以将数据挖掘过程划分为数据清理、数据集成、数据选择与变换、数据挖掘及_______等阶段。‍
答案: 【 知识评估

10、填空题:
‌数据挖掘任务主要包括描述性和______任务‌
答案: 【 预测性

2 Data

Test 2

1、单选题:
‏age 值(以递增序)为:13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70。使用 z-score 规范化将 age 值 35 变换到[0.0,1.0]区间,变换后的值为()‎
选项:
A: 0.4
B: 0.1
C: 0.9
D: 0.3
答案: 【 0.4

2、单选题:
‌一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是:()‎
选项:
A: 一年级
B: 二年级
C: 三年级
D: 四年级
答案: 【 一年级

3、单选题:
‌假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:()‌
选项:
A: 0.821
B: 1.224
C: 1.458
D: 0.716
答案: 【 0.716

4、单选题:
‎属性Hair_color = {auburn, black, blond, brown, grey, red, white},该属性属于()类型‌
选项:
A: 标称
B: 二分
C: 序数
D: 数值
答案: 【 标称

5、单选题:
‍下面不属于数据集特征的是()‍
选项:
A: 连续性
B: 维度
C: 稀疏性
D: 分辨率
答案: 【 连续性

6、填空题:
一个数据集的分布的五数概括由最小值、第一个四分位数、_______、第三个四分位数、和最大值构成。‍‌‍
答案: 【 中位数

7、填空题:
‎定用于分析的数据包含属性age。age 值(以递增序)为:13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70。则数据的第一个四分位数的值为__,第三个四分位数的值为35‍
答案: 【 20

8、填空题:
‍考虑值集{12 24 33 24 55 68 26},其四分位数极差是:___‎
答案: 【 31

9、填空题:
​数据集的属性可以划分为____和连续型两种。‍
答案: 【 离散型

10、填空题:
‎两个向量d1 = (1,1,2,1,1,1,0,0,0) d2 =  (1,1,1,0,1,1,1,1,1)的余弦相似度为()‌‎‌
答案: 【 [0.8,0.83]

3 Data Preprocessing

Test 3

1、单选题:
​假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?()‎
选项:
A: 第一个
B: 第二个
C: 第三个
D: 第四个
答案: 【 第二个

2、单选题:
‎以下哪种方法不是常用的数据约减方法()‍
选项:
A: 抽样
B: 回归
C: 聚类
D: 关联规则挖掘
答案: 【 关联规则挖掘

3、单选题:
‌假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22

剩余75%内容付费后可查看

发表评论

电子邮件地址不会被公开。 必填项已用*标注