数据篇

数据篇单元检测

1、单选题:
下列不属于数据清理步骤的操作是​
选项:
A: 去重复数据
B: 纠正错误数据
C: 词性标注
D: 去掉停用词
答案: 【 词性标注

2、单选题:
下列哪个专用词表示分词操作​
选项:
A:  Part-Of-Speech Tagging
B: word stemming
C: tokenization
D: vectorization
答案: 【 tokenization

3、单选题:
下列哪个工具不属于搜索引擎‌
选项:
A:  360浏览器
B: Google
C: Baidu
D: Bing
答案: 【  360浏览器

4、单选题:
Google搜索引擎的核心算法是‌
选项:
A:  SVM
B:  pagerank
C: 朴素贝叶斯
D: LDA
答案: 【  SVM

5、单选题:
以下不属于OTA平台的是‏
选项:
A: 携程
B: 美团旅行
C: 中青旅
D: 飞猪
答案: 【 中青旅

6、单选题:
以下哪些不属于用户属性数据的优势​
选项:
A: 分析目标人群
B: 精准营销
C: 预测游客出游轨迹
D: 市场分析
答案: 【 预测游客出游轨迹

7、单选题:
GPS全球定位系统由多少颗卫星组成​
选项:
A: 7
B: 12
C: 36
D: 24
答案: 【 24

8、单选题:
GPS控制部分的主要作用?‏
选项:
A: 发送导航定位的卫星信号
B: 监测和控制卫星运行
C: 导航定位
D: 采集经纬度和高度
答案: 【 监测和控制卫星运行

9、多选题:
UGC文本数据具有的特点是‍
选项:
A: 真实性
B: 广泛性
C: 权威性
D: 可获得性
答案: 【 真实性;
广泛性;
可获得性

10、多选题:
以下哪些属于旅游文本范围?‏
选项:
A: 用户评价reveiw
B: 游记
C: 朋友圈晒照
D: PGC
答案: 【 用户评价reveiw;
游记;
PGC

11、多选题:
关于PGC,以下描述正确的是‌
选项:
A: 也称PPC
B: 是用户在游后对旅游活动进行的评价和内容发布
C: 生产者具有一定的知识背景和工作资历
D: 通常和UGC相对
答案: 【 也称PPC;
生产者具有一定的知识背景和工作资历;
通常和UGC相对

12、多选题:
旅游文本可以用来研究‏
选项:
A: 酒店游客满意度
B: 目的地口碑声誉
C: 旅游热门地推荐
D: 客户关系管理
答案: 【 酒店游客满意度;
目的地口碑声誉;
旅游热门地推荐;
客户关系管理

13、多选题:
下列哪种方法可以用在搜索数据关键词选取步骤中‍
选项:
A: 从相关报告的高频词中选取
B: 凭研究者知识背景和经验选取
C: 参考搜索引擎本身给出的关联词
D: 用pearson系数等数学指标确定相关关键词
答案: 【 从相关报告的高频词中选取;
凭研究者知识背景和经验选取;
参考搜索引擎本身给出的关联词;
用pearson系数等数学指标确定相关关键词

14、多选题:
图片的数字足迹可以体现出游客哪些方面的特色?‍
选项:
A: 游客性别
B: 游客行为
C: 分布与POI识别
D: 时空特征

剩余75%内容付费后可查看

发表评论

电子邮件地址不会被公开。 必填项已用*标注