1 绪论

测验

1、单选题:
‎什么是KDD?​
选项:
A: 数据挖掘与知识发现
B: 领域知识发现
C: 文档知识发现
D: 动态知识发现
答案: 【 数据挖掘与知识发现

2、单选题:
‍“8,000”和“10,000”表示:‎
选项:
A: 数据
B: 信息
C: 知识
D: 智慧
答案: 【 数据

3、单选题:
‌人从出生到长大的过程中,是如何认识事物的?​
选项:
A: 聚类过程
B: 分类过程
C: 先分类,后聚类
D: 先聚类,后分类
答案: 【 先聚类,后分类

4、单选题:
‌“8,000米是飞机飞行最大高度”与“10,000米的高山”表示:​
选项:
A: 数据
B: 信息
C: 知识
D: 智慧
答案: 【 信息

5、单选题:
‏“飞机无法飞过高山”表示:‌
选项:
A: 数据
B: 信息
C: 知识
D: 智慧
答案: 【 知识

2 认识数据

测验

1、单选题:
​下面哪个不属于数据的属性类型:‌
选项:
A: 标称
B: 序数
C: 区间
D: 相异
答案: 【 相异

2、单选题:
‎只有非零值才重要的二元属性被称作:‎
选项:
A: 计数属性
B: 离散属性
C: 非对称的二元属性
D: 对称属性
答案: 【 非对称的二元属性

3、单选题:
‏一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是:​
选项:
A: 一年级
B: 二年级
C: 三年级
D: 四年级
答案: 【 一年级

4、判断题:
‌杰卡德系数用来度量非对称的二进制属性的相似性​
选项:
A: 正确
B: 错误
答案: 【 正确

5、判断题:
‌欧式距离用来度量连续数值属性数据的相似性‌
选项:
A: 正确
B: 错误
答案: 【 正确

3 数据预处理

测验

1、单选题:
‏所谓高维数据,指的是‌
选项:
A: 数据对象很多
B: 数据属性很多
C: 以上都正确
D: 以上都错误
答案: 【 数据属性很多

2、单选题:
​假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:‎
选项:
A: 0.821
B:  1.224
C:  1.458
D:  0.716
答案: 【  0.716

3、单选题:
​假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?‎
选项:
A: 第一个
B: 第二个
C: 第三个
D: 第四个
答案: 【 第二个

4、判断题:
‏卡方测试用来度量离散标称属性数据的相关性‎
选项:
A: 正确
B: 错误
答案: 【 正确

5、判断题:
‏相关系数用来度量标称属性数据的相关性‏
选项:
A: 正确
B: 错误
答案: 【 错误

4 朴素贝叶斯分类

测验

1、单选题:
​考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是主场获胜。如果下一场比赛在队1的主场进行队1获胜的概率为‎
选项:
A: 0.75
B: 0.35
C: 0.4678
D: 0.5738
答案: 【 0.5738

2、单选题:
​朴素贝叶斯分类器的朴素之处在于:‌
选项:
A: 只能处理低维属性
B: 只能处理离散型属性
C: 分类效果一般
D: 属性之间的条件独立性假设
答案: 【 属性之间的条件独立性假设

3、判断题:
‏Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。‏
选项:
A: 正确
B: 错误
答案: 【 错误

4、判断题:
‏可以利用概率统计方法估计数据的分布参数,再进一步估计待测试数据的概率,以此来实现贝叶斯分类‎
选项:
A: 正确
B: 错误
答案: 【 正确

5、判断题:
‎贝叶斯分类器对离群点敏感‏
选项:
A: 正确
B: 错误
答案: 【 错误

剩余75%内容付费后可查看

发表评论

电子邮件地址不会被公开。 必填项已用*标注