奥鹏易百

 找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

帮助中心知识拓展客服QQ 515224986
查看: 788|回复: 0

南开大学《大数据导论》19秋期末考核(面部识别+一次提...

[复制链接]

2万

主题

27

回帖

6万

积分

管理员

积分
60146
发表于 2020-3-28 16:52:10 | 显示全部楼层 |阅读模式
扫码加微信
南开大学《大数据导论》19秋期末考核(面部识别+一次提交)

试卷总分100得分100
第1题以下不是数据仓库基本特征的是()
A、数据仓库是面向主题的
B、数据仓库是面向事务的
C、数据仓库的数据是相对稳定的
D、数据仓库的数据是反映历史变化的
正确答案
第2题()是MicrosoftOffice的核心组件
A、SQL
B、WORD
C、PPT
D、EXCEL
正确答案
第3题数据清洗的方法不包括
A、缺失值处理
B、噪声数据清除
C、一致性检查
D、重复数据记录处理
正确答案
第4题数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段()。
A、运营式系统阶段
B、用户原创内容阶段
C、感知式系统阶段
正确答案
第5题下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A、ggplot2
B、network
C、ggmaps
D、animation
正确答案
第6题下列不属于Google云计算平台技术架构的是()
A、并行数据处理MapReduce
B、分布式锁Chubby
C、结构化数据表BigTable
D、弹性云计算EC2
正确答案
第7题大数据的最显著特征是()。
A、数据规模大
B、数据类型多样
C、数据处理速度快
D、数据价值密度高
正确答案
第8题IaaS是()的简称
A、软件即服务
B、平台即服务
C、基础设施即服务
D、硬件即服务
正确答案
第9题基础设施即服务的英文简称是
A、IaaS
B、PaaS
C、SaaS
正确答案
第10题下列哪个工具常用来开发移动友好地交互地图()
A、Leaflet
B、Visual.ly
C、BPizzaPieCharts
D、Gephi
正确答案
第11题数据归约(DataReduction)主要有()
A、维度规约
B、样本规约
C、数据聚集
D、离散化概念分层
正确答案BCD
第12题以下可以用于数据可视化的是()。
A、R语言
B、Excel
C、RapidMiner
D、Weka
正确答案BCD
第13题医疗大数据特点除了包含了大数据4个&quotV&quot的特点之外还有()
A、多态性
B、时效性
C、不完整性
D、冗余性
正确答案BCD
第14题大数据存储的特点与挑战有()
A、容量问题
B、延迟问题
C、安全问题
D、成本问题
正确答案BCD
第15题大数据智能感知层主要包括()及软硬件资源接入系统
A、数据传感体系
B、网络通信体系
C、传感适配体系
D、智能识别体系
正确答案BCD
第16题数据预处理的过程主要是
A、数据清洗
B、数据集成
C、数据变换
D、数据规约
正确答案BCD
第17题交通数据处理包括以下几个步骤()
A、数据清洗
B、数据映射
C、数据组织
D、数据聚类
正确答案BCD
第18题数据工厂包括
A、低能耗数据中心
B、超大规模讲分布式架构
C、新一代智能自动化运维
D、超强云安全
正确答案BCD
第19题可视化工具包括()
A、Excel
B、GoogleChart
C、Gephi
D、ppt
正确答案BC
第20题去除噪声使得数据光滑的技术主要有
A、分箱
B、回归
C、离群点分析
正确答案BC
第21题在未来掘金社交数据的道路上一方面要为用户提供更加精准便捷的良好服务另一方面也要注重对用户隐私的保护。只有符合用户需求和用户安全的商业利益才能成为可持续的商业利益。
T、对
F、错
正确答案T
第22题每个簇的质心(centroid)是该簇中所有数据对象的均值。
T、对
F、错
正确答案T
第23题数据存储要表现出静态数据的特征反映的是系统中静止的数据。
T、对
F、错
正确答案T
第24题不同类型的大数据可以揭示一个区域或城市的活动以及人口分布状态()
T、对
F、错
正确答案T
第25题Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式它需要收集超过100TB的数据并且是高速实时数据流或者是从小数据开始但数据每年增长速率至少为60%。
T、对
F、错
正确答案F
第26题未来考验零售企业的是如何挖掘消费者需求
T、对
F、错
正确答案T
第27题减少已分配但未使用的存储容量的浪费在分配存储空间时系统按需分配存储空间。
T、对
F、错
正确答案T
第28题数据存储是数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。
T、对
F、错
正确答案T
第29题ApacheSpark是专为大规模数据处理而设计的快速通用的计算引擎。
T、对
F、错
正确答案T
第30题FP算法比Apriori算法慢
T、对
F、错
正确答案F
第31题轨迹数据包含空间和时间属性并且通常规模巨大且维度高
T、对
F、错
正确答案T
第32题Apriori算法扫描数据库的次数等于最大频繁项集的项数。
T、对
F、错
正确答案T
第33题Facebook积累了超过12亿全球用户其存储了大量的用户数据这使它成为一个巨大的&quot数据乐园&quot。人们越来愈倾向于在Facebook上表达自己的情绪。
T、对
F、错
正确答案T
第34题大数据处理的关键技术主要包括数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。
T、对
F、错
正确答案T
第35题R是一种开源编程语言和软件环境用于数据挖掘、数据分析和可视化。
T、对
F、错
正确答案T
第36题简述数据可视化的流程和步骤。
正确答案
第37题简述网络大数据的一般采集过程。
正确答案
第38题NoSQL
正确答案
第39题批处理
正确答案
第40题数据清洗
正确答案
第41题结构化数据
正确答案

奥鹏易百网www.openhelp100.com专业提供网络教育各高校作业资源。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|www.openhelp100.com ( 冀ICP备19026749号-1 )

GMT+8, 2024-11-25 13:10

Powered by openhelp100 X3.5

Copyright © 2001-2024 5u.studio.

快速回复 返回顶部 返回列表