绪论 单元测试

1、单选题:
下列对大数据的特点描述不正确的是( )
选项:
A:价值密度高
B:数据体量巨大
C:速度要求快
D:数据类型多样
答案: 【价值密度高

第一章 单元测试

1、判断题:
云主机和物理机的寿命都是永久性的。( )
选项:
A:错
B:对
答案: 【

2、判断题:
对于实时性要求高的应用,需要应用实时处理架构。( )
选项:
A:错
B:对
答案: 【

3、判断题:
数据仓库是用来存储数据的而不是分析数据的。( )
选项:
A:错
B:对
答案: 【

4、判断题:
在DWS层中,用户行为日志数据分为公共字段和事件字段。( )
选项:
A:对
B:错
答案: 【

5、单选题:
项目实施流程中没有( )
选项:
A:数据仓库设计开发
B:数据访问
C:下载数据
D:数据导出
答案: 【下载数据

6、单选题:
数据分析在企业中的作用( )
选项:
A:帮助企业经营者平衡企业的收益
B:干预经营者的决策
C:帮助企业经营者减少投入
D:直接的获取经营的利润
答案: 【直接的获取经营的利润

7、单选题:
数据结构中哪项不是页面入口的来源( )
选项:
A:详情页
B:登录页
C:应用首页
D:push
答案: 【登录页

8、多选题:
Hadoop的三大发行版本是 ( )
选项:
A:Apache
B:CDH
C:Java
D:HDP
答案: 【Apache;
CDH;
HDP

9、多选题:
流量分析常见指标有哪些方面 ( )
选项:
A:转化路径分析
B:受访分析
C:来源分析
D:访客分析
答案: 【转化路径分析;
受访分析;
来源分析;
访客分析

10、多选题:
网站流量数据分析的意义有哪些 ( )
选项:
A:从多方面提供网站分析的数据依据
B:帮助网站运营人员获取网站流量信息
C:帮助提高网站流量
D:提升网站用户体验
答案: 【从多方面提供网站分析的数据依据;
帮助网站运营人员获取网站流量信息;
帮助提高网站流量;
提升网站用户体验

第二章 单元测试

1、判断题:
Hadoop是一种分布式系统基础架构,主要解决海量数据存储和海量数据计算两大问题。( )
选项:
A:错
B:对
答案: 【

2、判断题:
在HDFS配置文件中,主要配置的就是hdfs-site.xml配置文件。( )
选项:
A:对
B:错
答案: 【

3、判断题:
在Hadoop分布式集群中,不需要对集群中的每一个节点都进行ip规划。( )
选项:
A:对
B:错
答案: 【

4、判断题:
利用HDFS操作命令可以将数据文件从本地上传到HDFS上,也可以将数据文件从HDFS下载到本地。( )
选项:
A:对
B:错
答案: 【

5、判断题:
在HDFS API操作中, closeFileSystem方法的功能是释放文件系统对象的资源。( )
选项:
A:对
B:错
答案: 【

6、判断题:
MapReduce词频统计案例中,执行map任务的最后阶段,会将缓冲区的数据全部写入到磁盘。( )
选项:
A:错
B:对
答案: 【

7、判断题:
Flume是Cloudera公司提供的一款高可用、高可靠、分布式的系统,可用于海量日志采集、聚合和传输。( )
选项:
A:对
B:错
答案: 【

8、单选题:
能在网络中安全传输文件的软件是( )。
选项:
A:Xshell
B:IDEA
C:Xftp6
D:VMware
答案: 【Xftp6

9、单选题:
创建了bigdata用户的命令是( )。
选项:
A:Sudoers
B:subigdata
C:bigdataALL
D:useraddbigdata
答案: 【useraddbigdata

10、单选题:
论文( ),主要论证的核心是如何采用分布式的架构对海量数据进行分布式计算。
选项:
A:MapReduce
B:BigTable
C:GFS
D:HDFS
答案: 【MapReduce

11、单选题:
假如我们设定hdfs块的大小是128M,那么,一个大小为500M的数据文件,将会被拆分成( )个分片
选项:
A:2
B:3
C:4
D:5
答案: 【4

12、单选题:
在Linux命令行中,使用( )命令格式化hive元数据库
选项:
A:Schematool
B:Format
C:Clear
D:Del
答案: 【Schematool

13、单选题:
在Hive中给表添加数据,使用( )方式给表添加数据效率更高。
选项:
A:append
B:insertinto
C:Add
D:Load
答案: 【Load

14、单选题:
关系型数据库与HDFS之间相互数据迁移的工具是( )。
选项:
A:fsck
B:sqoop
C:distcp
D:fastcopy
答案: 【sqoop

15、多选题:
Notepad++功能有( )。
选项:
A:编写计算机程序代码
B:可以连接虚拟机,对虚拟机中的文件进行编辑。
C:语法高亮度显示、语法折叠功能、支持宏、扩充基本功能的外挂模组
D:制作一般的纯文字说明文件
答案: 【编写计算机程序代码;
可以连接虚拟机,对虚拟机中的文件进行编辑。;
语法高亮度显示、语法折叠功能、支持宏、扩充基本功能的外挂模组;
制作一般的纯文字说明文件

16、多选题:
Hadoop主要包含( )三大功能组件。
选项:
A:Hadoop
B:YARN
C:HDFS
D:MapReduce
答案: 【YARN;
HDFS;
MapReduce

17、多选题:
Hadoop具有( )等优势。
选项:
A:高扩展性
B:高效性
C:高可靠性
D:高容错性
答案: 【高扩展性;
高效性;
高可靠性;
高容错性

18、多选题:
下面说法正确的是( )。
选项:
A:JRE是java运行运行时类库
B:JDK是java语言的开发环境
C:java编程的核心就是JVM,JVM是JRE的一部分,它是一个虚拟出来的计算机。
D:JDK包含JRE和JVM
答案: 【JRE是java运行运行时类库;
JDK是java语言的开发环境;
java编程的核心就是JVM,JVM是JRE的一部分,它是一个虚拟出来的计算机。;
JDK包含JRE和JVM

19、多选题:
在分布式文件系统HDFS当中提供了两种操作命令,是( )。
选项:
A:hadoop fs
B:hdfs dfs
C:Hadoop dfs
D:hdfs fs
答案: 【hadoop fs;
hdfs dfs

20、多选题:
Hive是基于Hadoop技术的数据仓库工具,用来对数据进行( )
选项:
A:分析
B:转化
C:加载
D:提取
答案: 【转化;
加载;
提取

21、多选题:
启动Hive服务之前需要启动的两个服务是( )。
选项:
A:hive--service hiveserver
B:hive--server metastore
C:hive--service metastore
D:hive--service hiveserver2
答案: 【hive--server metastore;
hive--service hiveserver2

22、多选题:
Hive的复杂数据类型有( )。
选项:
A:Char
B:ARRAY
C:STRUCT
D:MAP
答案: 【ARRAY;
STRUCT;
MAP

23、多选题:
Kafka是一种高吞吐量的分布式发布订阅消息系统,是apache基金会开源的消息队列,该框架由( )编写而成。
选项:
A:Python
B:Scala
C:C++
D:Java
答案: 【Scala;
Java

24、多选题:
安装zookeeper成功的标志是,把3台虚拟机中的zookeeper全部启动,启动命令是zkServer.shstart,然后查看3台虚拟机中的zookeeper的状态,命令是zkServer.shstatus,如果安装正确,此时我们应该分别看到1个、多个( )。
选项:
A:follower
B:zkServer
C:zookeeper
D:leader
答案: 【follower;
leader

发表评论

电子邮件地址不会被公开。 必填项已用*标注