第一讲 数据挖掘导论

数据挖掘导论单元测试

1、判断题:
‏数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成数据描述、预测数据等任务.​
选项:
A: 正确
B: 错误
答案: 【 正确

2、判断题:
​寻找模式和规则主要是对数据进行干扰,使其符合某种规则以及模式。‏
选项:
A: 正确
B: 错误
答案: 【 错误

3、判断题:
‍分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值。‌
选项:
A: 正确
B: 错误
答案: 【 正确

4、判断题:
‎数据挖掘的过程可以粗略分为:问题定义、数据准备、数据预处理、数据挖掘,以及结果的解释和评估等步骤。‏
选项:
A: 正确
B: 错误
答案: 【 正确

5、判断题:
‎决策树方法可以称为一种数据挖掘技术,也可以称为一种机器学习技术,所以数据挖掘和机器学习是一样的。‍
选项:
A: 正确
B: 错误
答案: 【 错误

6、判断题:
‏数据挖掘是从大量的数据中筛选出有效的、可信的以及隐含信息的高级处理过程。‏
选项:
A: 正确
B: 错误
答案: 【 正确

第二讲 数据仓库与联机分析处理

数据仓库与OLAP单元测试

1、单选题:
‏ 数据仓库是随着时间变化的,下面的描述不正确的是:‏
选项:
A: 数据仓库随时间的变化不断增加新的数据内容。
B: 捕捉到的新数据不会覆盖原来的快照。
C:  数据仓库随事件变化不断删去旧的数据内容。
D: 数据仓库中包含大量的综合数据。
答案: 【  数据仓库随事件变化不断删去旧的数据内容。

2、单选题:
‏OLAP技术的核心是: ‎
选项:
A: 在线性
B: 对用户的快速响应
C: 互操作性
D: 多维分析
答案: 【 多维分析

第三讲 数据预处理

数据预处理单元测试

1、单选题:
‎假定某属性的最小与最大值分别为8000元和14000元。要将其映射到区间[0.0,1.0],按照最小-最大规范化方法对属性进行变换,属性值12600将变换为:‍
选项:
A: 0.751
B: 0.767
C: 0.813
D: 0.827
答案: 【 0.767

2、单选题:
​若属性income的平均值和标准差分别为32000元和17000元,则使用z-score规范化后,65600元被转换为:‏
选项:
A: 1.867
B: 2.201
C: 1.987
D: 0.778
答案: 【 1.867

3、判断题:
‎等宽分箱法使每个箱子的取值区间相同。​
选项:
A: 正确
B: 错误
答案: 【 正确

4、判断题:
‏数据取样时,除了要求抽样时严把质量关外,还要求抽样数据必须在足够范围内有代表性。​
选项:
A: 正确
B: 错误
答案: 【 正确

剩余75%内容付费后可查看

发表评论

电子邮件地址不会被公开。 必填项已用*标注