第一讲 绪论

第一讲测试

1、单选题:
‏以下关于分析型数据,正确的是‌
选项:
A: 分析型数据是可更新的
B: 分析型数据一次操作的数据量较大
C: 分析型数据是事务驱动的
D: 分析型数据关注细节
答案: 【 分析型数据一次操作的数据量较大

2、多选题:
‎以下哪些属于监督学习?‏
选项:
A: 朴素贝叶斯
B: 支持向量机
C: 聚类
D: 决策树
答案: 【 朴素贝叶斯;
支持向量机;
决策树

3、多选题:
‍数据挖掘可以挖掘的数据模式有?‏
选项:
A: 聚类分析
B: 预测分析
C: 关联与相关性
D: 离群点分析
答案: 【 聚类分析;
预测分析;
关联与相关性;
离群点分析

4、判断题:
‌半监督学习中,无标签数据的数量远大于有标签数据的数量‎
选项:
A: 正确
B: 错误
答案: 【 正确

5、判断题:
‍有监督学习是分类同时定性的,而无监督学习是先聚类后定性的‌
选项:
A: 正确
B: 错误
答案: 【 正确

第二讲 数据仓库与OLAP

第二讲测试

1、单选题:
‎下列有关数据立方体的说法正确的是?‏
选项:
A: 在多维数据模型中,数据以数据立方体的形式存在
B: 数据立方体是三维的
C: 数据立方体只能有一个事实
D: 数据立方体只能用于数据集市,不能用于数据仓库的设计
答案: 【 在多维数据模型中,数据以数据立方体的形式存在

2、单选题:
‏ETL不包括?​
选项:
A: Extract
B: Transform
C: Load
D: Transfer
答案: 【 Transfer

3、多选题:
​数据仓库的特征是?‎
选项:
A: 面向主题的
B: 集成额
C: 稳定的
D: 具有时间特征的
答案: 【 面向主题的;
集成额;
稳定的;
具有时间特征的

4、多选题:
​OLAP的基本操作不包括?‍
选项:
A: 切片
B: 修改
C: 删除
D: 旋转
答案: 【 修改;
删除

5、多选题:
‎下列说法正确的是?‏
选项:
A: 数据集市是小型的数据仓库
B: 数据仓库的数据源可来自不同的业务系统
C: 数据仓库定期接受数据,因此数据仓库是不稳定的
D: 数据仓库存储的一般都是综合性、历史的数据,数据一般不会更新。
答案: 【 数据集市是小型的数据仓库;
数据仓库的数据源可来自不同的业务系统;
数据仓库存储的一般都是综合性、历史的数据,数据一般不会更新。

第三讲 聚类分析

第三讲测试

1、单选题:
‌以下哪些方法可以确定K-均值算法已经收敛?‏
选项:
A: 划分不再改变
B: 聚类中心不再改变
C: 固定次数的迭代
D: 以上三种均是
答案: 【 以上三种均是

2、单选题:
‏以下哪些算法可以处理非高斯数据?​
选项:
A: K-means算法
B: EM算法
C: 谱聚类算法
D: 以上三种算法都可以
答案: 【 谱聚类算法

3、多选题:
‍无监督学习可以应用于哪些方面?‌
选项:
A: 图像压缩
B: 生物信息学:学习基因组
C: 客户细分(即分组)
D: 学习没有任何标签的聚类/群组
答案: 【 图像压缩;
生物信息学:学习基因组;
客户细分(即分组);
学习没有任何标签的聚类/群组

4、多选题:
‍以下哪些选项是K-均值聚类面临的问题?‍
选项:
A: K的选择具有挑战性
B: 硬聚类并不总是正确的
C: 贪婪算法存在的问题
D: 关于数据的球形假设(到聚类中心的距离)
答案: 【 K的选择具有挑战性;
硬聚类并不总是正确的;
贪婪算法存在的问题;
关于数据的球形假设(到聚类中心的距离)

5、多选题:
‍聚类可以应用于哪些方面?‏

剩余75%内容付费后可查看

发表评论

电子邮件地址不会被公开。 必填项已用*标注