第1章 引论

第1章 单元测验

1、单选题:
‍大数据是一个什么领域的问题()。‍
选项:
A: 计算机领域
B: 数学统计领域
C: 业务领域
D: 多学科综合领域
答案: 【 多学科综合领域

2、单选题:
‍科学研究第四范式数据思维采用()。‎
选项:
A: 科学归纳
B: 模型推演
C: 仿真模拟
D: 关联分析
答案: 【 关联分析

3、多选题:
‌大数据的优势包括()。‏
选项:
A: 数据体量大
B: 收集时间短
C: 数据类型丰富 
D: 价值密度高
答案: 【 数据体量大;
收集时间短;
数据类型丰富 

4、多选题:
‏大数据处理框架之批处理框架()。‍
选项:
A: hadoop
B: Spark
C: Flink 
D: jvm
答案: 【 hadoop;
Spark;
Flink 

5、多选题:
‍大数据处理框架之流计算框架()。‏
选项:
A:  hadoop
B: Spark streaming
C: Flink
D: STORM
答案: 【 Spark streaming;
Flink;
STORM

6、填空题:
‍系统的控制方式一般分为模型驱动和_____________。‎
答案: 【 数据驱动

7、填空题:
‌4V特征:数据规模大 、_________、数据处理速度快、价值密度低。​
答案: 【 数据类型多

8、填空题:
‌大数据的处理过程:数据获取与管理、数据存储与处理、数据分析与______、结合领域的大数据应用。​
答案: 【 理解

9、填空题:
‏科学研究的第三范式 计算思维- ______。​
答案: 【 仿真模拟

10、填空题:
‌大数据领域的职业包括首席数据官、系统架构师、___________、领域科学家。‏
答案: 【 数据分析师

第2章 大数据感知与获取

第2章单元测验

1、单选题:

‏选项:
A: M1-M2-M3-S4-M5-M6-M8-S7
B: M1-M2-M5- M8- M6-M3-S7-S4
C: M1-M2-M3-S4-M5-M6- S7 - M8
D: M1-M2-M5- M8- M6-M3- S4 - S7
答案: 【 M1-M2-M5- M8- M6-M3-S7-S4

2、单选题:
​下面科学研究的四个范式顺序正确的是 ( )。‎
选项:
A: 经验范式-理论范式-模拟范式-数据密集型范式
B: 理论范式-模拟范式-经验范式-数据密集型范式
C: 理论范式-模拟范式-数据密集型范式-经验范式
D: 理论范式-经验范式-数据密集型范式-模拟范式
答案: 【 经验范式-理论范式-模拟范式-数据密集型范式

3、单选题:
‍以数据考察为基础,联合理论、实验和模拟一体的数据密集计算的范式是以下哪个范式 ( )。‎
选项:
A: 经验范式
B: 理论范式
C: 模拟范式
D: 数据密集型范式
答案: 【 数据密集型范式

4、单选题:
‌在大数据生命周期的各个阶段中,工作最多的是哪个阶段 ( )。‏
选项:
A: 数据存储
B: 数据收集和整理
C: 数据分析
D: 数据治理
答案: 【 数据收集和整理

5、单选题:
‌在增量抽取方法中,需要计算MD5校验码的是哪种增量抽取方法 ( ) 。‍
选项:
A: 日志对比 
B: 时间戳  
C: 触发器
D: 全表对比
答案: 【 全表对比

6、单选题:
‍在网络爬虫策略中需要根据链接计算网页重要性的是以下哪个算法 ( ) 。‌
选项:
A: 深度优先
B: 广度优先
C: 局部PageRank策略
D: OPIC
答案: 【 局部PageRank策略

7、多选题:
‌大数据中的非结构化数据包括 ( )。‏
选项:
A: 图像
B: 文本
C: 语音
D: 视频
答案: 【 图像;
文本;
语音;
视频

8、多选题:
‍大数据中的半结构化数据包括 ( )。‌
选项:
A: 办公文档
B: 电子邮件
C: XML
D: HTML 
答案: 【 电子邮件;
XML;
HTML 

9、多选题:
‍常见的分布式网络爬虫架构有 ( ) 。‌
选项:
A: Master-worker
B:  Master-slave 
C: peer-peer
D: Mixed
答案: 【  Master-slave ;
peer-peer;
Mixed

10、多选题:
​以下哪些内容属于深网内容 ( )。‌
选项:
A: 通过搜索引擎搜索得到的结果
B: Web上可访问的非网页文件,比如图片文件,Pdf和word文档等
C: 通过填写表单形成对后台在线数据库的查询而得到的动态页面
D: 需要注册或其他限制才能访问的内容
答案: 【 Web上可访问的非网页文件,比如图片文件,Pdf和word文档等;
通过填写表单形成对后台在线数据库的查询而得到的动态页面;
需要注册或其他限制才能访问的内容

第3章 大数据存储与管理

第3章 单元测验

1、单选题:
​HBase依靠(  )存储底层数据 。​
选项

剩余75%内容付费后可查看

发表评论

电子邮件地址不会被公开。 必填项已用*标注