南开21秋学期《大数据导论》在线作业(随机题目)
21秋学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据导论》在线作业试卷总分100得分100
南开大学2021年秋季学期在线作业
第1题哪个选项不属于大数据4V特点?
A、Volume
B、Valid
C、Variety
D、Value
正确答案
第2题第一个提出大数据概念的公司是()。
A、麦肯锡公司
B、谷歌公司
C、微软公司
D、脸谱公司
正确答案
第3题数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段()。
A、运营式系统阶段
B、用户原创内容阶段
C、感知式系统阶段
正确答案
第4题数据清洗的方法不包括
A、缺失值处理
B、噪声数据清除
C、一致性检查
D、重复数据记录处理
正确答案
基础设施即服务的英文简称是
A、IaaS
B、PaaS
C、SaaS
正确答案
第6题用于描述相等时间间隔下连续数据随时间变化趋势的是()
A、折线图
B、散点图
C、条形图
D、饼图 奥鹏在线作业
正确答案
第7题DAS代表的意思是()
A、两个异步存储
B、数据归档软件
C、连接一个可选的存储
D、直连存储
正确答案
第8题下列哪个R语言扩展包可以创建带有点和边的网络图()
A、ggplot2
B、network
C、ggmaps
D、animation
正确答案
第9题用于描述数据分散情况的是()
A、分布图
B、箱式图
C、饼图
D、折线图
正确答案
SAN是一种()
A、存储设备
B、专为数据存储而设计构建的网络
C、光纤交换机
D、HBA
正确答案
第11题IaaS是()的简称
A、软件即服务
B、平台即服务
C、基础设施即服务
D、硬件即服务
正确答案
数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。
A、运营式系统阶段
B、用户原创内容阶段
C、感知式系统阶段
正确答案
第13题数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段()。
A、运营式系统阶段
B、用户原创内容阶段
C、感知式系统阶段
正确答案
第14题下列不属于Google云计算平台技术架构的是()
A、并行数据处理MapReduce
B、分布式锁Chubby
C、结构化数据表BigTable
D、弹性云计算EC2
正确答案
下列不属于商业大数据类型的是
A、传统企业数据
B、机器和传感器数据
C、社交数据
D、电子商务数据
正确答案
第16题借助于大数据提供的##和##政府可为农业生产进行合理引导依据需求进行生产避免产能过剩造成不必要的资源和社会财富浪费。
A、消费能力
B、趋势报告
C、购物结果
正确答案B
第17题数据分析的类型根据数据分析深度可以分为()
A、描述性分析
B、预测性分析s
C、规则性分析
正确答案BC
第18题大数据带来的挑战有哪些()。
A、会导致数据盲点
B、危及个人隐私
C、造成群体歧视
D、产生庞大能耗
正确答案BCD
第19题数据归约(DataReduction)主要有有()
A、维度规约
B、样本规约
C、数据聚集
D、离散化概念分层
正确答案BCD
大数据采集主要包括()四种。
A、系统日志采集
B、网络数据采集
C、数据库采集
D、其他数据采集
正确答案BCD
第21题互连网上出现的海量信息可以划分为三种分别为()
A、结构化信息
B、非结构化信息
C、半结构化信息
D、特殊化信息
正确答案BC
第22题以下可以用于数据可视化的是()。
A、R语言
B、Excel
C、RapidMiner
D、Weka
正确答案BCD
第23题常见的非结构化数据有()
A、web网页
B、即时消息
C、富文本文档
D、实时多媒体数据
正确答案BCD
第24题##和##它们把原数据变换或投影到较小的空间。
A、小波变换
B、中心化变换
C、主成分分析
D、对数变换
正确答案C
基于大数据的临床决策支持系统的架构包括
A、支撑层
B、大数据分析层
C、网络层
D、应用层
正确答案BD
第26题KNIME(KonstanzInformationMiner)是一个对用户友好的、智能、开源的平台。该平台包括了##、##、##、##。
A、数据集成
B、数据处理
C、数据分析
D、数据挖掘
正确答案BCD
第27题数据变换的常用方法有########
A、中心化变换
B、极差规格化变换
C、标准化变换
D、对数变换
正确答案BCD
第28题数据工厂包括
A、低能耗数据中心
B、超大规模讲分布式架构
C、新一代智能自动化运维
D、超强云安全
正确答案BCD
第29题大数据四大特征包括()
A、数据量大
B、数据类型繁多
C、数据价值密度相对较低
D、处理速度快,时效性要求高
正确答案BCD
交通数据分析可用于
A、交通流量实时分析
B、合理进行道路规划
C、信号灯智能调度
D、实时路况查询播报
正确答案BCD
第31题通常将统计指标的数值按长度顺序排列所形成的数列称为时间序列。
T、对
F、错
正确答案F
第32题交通数据集通常包括空间和时间特性而且跨越大范围的时间空间。数据聚类可以有效的减小数据规模为随后的分析提供便利。
T、对
F、错
第33题数据存储和处理不是大数据发展面临的挑战
T、对
F、错
正确答案F
第34题所有关系型数据中的数据全部为结构化数据。半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据。
T、对
F、错
第35题大数据数据量一定是PBTB级的
T、对
F、错
正确答案F
第36题NewSQL是对各种可扩展/高性能数据库的简称这类数据库在保持了传统数据库支持ACID和SQL等能力的同时还具有NoSQL对海量数据的存储管理能力。
T、对
F、错
第37题大数据的应用之一是促进健康管理的个性化和多元化。
T、对
F、错
第38题原始数据的错误异常值和冲突值必须被清理。典型的数据清洁操作包含三个阶段审计数据发现差距选择转换来修正差距将转换应用到数据集。
T、对
F、错
第39题数据存在形式包括结构化数据和结构化数据
T、对
F、错
正确答案F
第40题利用云存储中的多租户技术满足了海量信息爆炸式增长趋势一定程度上节约企业存储成本提高效率。
T、对
F、错
正确答案F
第41题多元线性回归是线性回归的扩充其中涉及的属性多于两个并且数据拟合到一个多维曲面
T、对
F、错
第42题属性规范化通过将属性值按比例缩放使之落入一个小的特定空间。
T、对
F、错
第43题由于数据变成资源成为有价值的东西数据私有化和独占问题就是客观存在的成为关注的焦点。数据产权界定问题日益突出在数据权属确定的情况下数据商品化将成为必然选择
T、对
F、错
第44题Kafka是一种高吞吐量的的分布式发布订阅消息系统
T、对
F、错
第45题数据采集又称数据获取是大数据生命周期的第一个环节通过RFID射频识别技术传感器交互型社交网络移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。
T、对
F、错
第46题NoSQL是泛指非关系型、分布式和不提供ACID的数据库它不是单纯地反对关系型数据库而是强调键值存储和文档数据库的优点。
T、对
F、错
第47题非结构化数据是指非纯文本类数据没有标准格式无法直接解析出相应的值
T、对
F、错
第48题直接拿Python输出的图片用于印刷效果很好
T、对
F、错
正确答案F
第49题云存储是指通过集群应用、网络技术或分布式文件系统等功能将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作共同对外提供数据存储和业务访问功能的一个系统。
T、对
F、错
Humanmobility即人类移动性表示人类个体或群体在地理空间中具有特定意义的移动(Movement)所隐含的社会系统要素时空分布与演化规律。
T、对
F、错
本内容由易百教育整理发布
页:
[1]