南开21春学期《大数据开发技术(一)》在线作业(随机题目)
21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据开发技术(一)》在线作业试卷总分100得分100
南开在线作业答案 QQ 515224986
第1题MapTask和ReduceTask均由()启动。
A、Client
B、JobTracker
C、Task
D、TaskTracker
正确答案
第2题MongoDB将数据存储为一个()
A、关系
B、属性
C、字段
D、文档
正确答案
第3题MapReduce中最优的Reduce任务个数取决于集群中可用的()的数目。
A、Split
B、Slot
C、Map
D、Shuffle
正确答案
第4题Hbase中()文件记录了ROOT表的位置
A、Master
B、Region
C、Zookeeper 易百教育www.openhelp100.com
D、Chubby
正确答案
BigTable采用()作为底层数据存储
A、HDFS
B、GFS
C、Hbase
D、传统文件系统
正确答案
第6题Hadoop启动所有进程的命令为()。
A、allstart.sh
B、allstart.exe
C、startall.sh
D、startall.exe
正确答案
第7题MapReduce处理关系的()运算时Map过程需要记录元组的信息及该元组来源。
A、投影
B、差
C、交
D、并
正确答案
第8题Hbase中()是最核心的模块负责维护分配给自己的Region并响应用户的读写请求
A、Master
B、Slaver
C、Regio服务器n
D、客户端
正确答案
第9题关于Strom中Bolt说法错误的是()。
A、Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作
B、Bolt是一个被动的角色,Spout是一个主动的角色
C、Bolt不仅可以处理Tuple还可以创建新的Tuple
D、Bolt是Streams的状态转换过程的抽象含义
正确答案
MapReduce设计的一个理念就是()因为移动数据需要大量的网络传输开销。
A、数据向计算靠拢
B、计算向数据靠拢
C、计算向网络靠拢
D、计算与数据并行
正确答案
第11题在Storm的工作流程中对于Supervisor说法错误的是()。
A、Supervisor会去Zookeeper集群上认领自己的Task
B、Supervisor节点首先将提交的Topology进行分片,分成一个个Task,分配给相应的Nimbus
C、Supervisor会将Task和相关的信息提交到Zookeeper集群上
D、Supervisor会通知自己的Worker进程进行Task的处理
正确答案
GoogleFusionTables是哪种可视化工具()
A、信息图表
B、地图工具
C、时间线工具
D、分析工具
正确答案
第13题批处理系统关注()流处理系统关注()。
A、吞吐率,延时
B、延时,吞吐率
C、延时,速度
D、速度,吞吐率
正确答案
第14题使用Amazon云环境部署Hadoop的说法中错误的是()。
A、Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中
B、Hadoop自带有一套脚本,用于在EC2上面运行Hadoop
C、在EC2上运行Hadoop尤其适用于一些工作流
D、AmazonEC2为Hadoop提供了存储服务
正确答案
关于分布式并行编程以下说法错误的是()。
A、t摩尔定律t,CPU性能大约每隔12个月翻一番
B、t摩尔定律t逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
C、分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
D、谷歌公司最先提出了分布式并行编程模型MapReduce
正确答案
第16题静态数据采取()计算模式
A、批量
B、实时
C、大数据
D、动态
正确答案
第17题优点是性能好(高并发)灵活性高复杂性低数据结构灵活
提供嵌入式文档功能的数据库是()
A、列族数据库
B、键值数据库
C、图数据库
D、文档数据库
正确答案
第18题关于MapReduce中Shuffle过程说法错误的是()。
A、Shuffle过程中为每个Map任务分配一个缓存
B、Shuffle过程中分区默认采用哈希函数
C、Shulle过程的合并会改变最终结果
D、Shuffle过程在Reduce端首先从Map端领取结果,然后执行归并操作,最后输送给Reduce任务进行处理。
正确答案
第19题Storm中如果要随机分发Stream中的Tuple保证每个Bolt的Task接收Tuple数量大致一致应该采用哪种StreamGroupings()。
A、ShuffleGrouping
B、AllGrouping
C、GlobalGrouping
D、FiedlsGrouping
正确答案
SQLAzure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流
A、ClientLayer
B、ServicesLayer
C、PlatformLayer
D、InfrastructureLayer
正确答案
第21题优点是查找速度快可扩展性强容易进行分布式扩展复杂性低的数据库是()
A、列族数据库
B、键值数据库
C、图数据库
D、文档数据库
正确答案
第22题应用于专门用于处理具有高度相互关联关系的数据比较适合于社交网络的数据库是哪种()
A、列族数据库
B、键值数据库
C、图数据库
D、文档数据库
正确答案
第23题Storm中如果要保证相同字段的Tuple分配到同一个Task中应该采用哪种StreamGroupings()。
A、ShuffleGrouping
B、AllGrouping
C、GlobalGrouping
D、FiedlsGrouping
正确答案
第24题应用于分布式数据存储与管理
数据在地理上分布于多个数据中心的应用程序的数据库是哪种()
A、列族数据库
B、键值数据库
C、图数据库
D、文档数据库
正确答案
1秒定律体现了大数据的哪个特征()。
A、数据量大
B、数据产生速度快
C、数据存储快
D、数据计算快
正确答案
第26题SQLAzure体系结构层中哪层是存储节点集群相当于普通Web系统的数据库层
A、ClientLayer
B、ServicesLayer
C、PlatformLayer
D、InfrastructureLayer
正确答案
第27题Gephi是哪种可视化工具()
A、信息图表
B、地图工具
C、时间线工具
D、分析工具
正确答案
第28题以下亚马逊的产品中哪个是分布式内存缓存
A、ElastiCache
B、RDS
C、DynamoDB
D、Redshift
正确答案
第29题Hadoop中执行MapReduce任务不含哪种方式()。
A、Mahout
B、Hadoopjar
C、Shell脚本
D、Python
正确答案
以下说法不正确的是()。
A、MapReduce的核心思想就是t分面治之t
B、HDFS是对GFS的开源实现
C、MapReduce是一种分布式计算模型
D、HDFS采用HBase作为其底层数据存储
正确答案
第31题关系数据库与NoSQL数据库相比有哪些优势()
A、支持事务ACID四性
B、可以支持超大规模数据存储
C、以完善的关系代数理论作为基础
D、具有强大的横向扩展能力
正确答案C
第32题MapReduce可以解决哪些计算问题()。
A、矩阵乘法
B、关系代数运算
C、聚合运算
D、关系投影运算
正确答案BCD
第33题关系数据库与NoSQL数据库相比适用于哪些领域()
A、电信
B、银行
C、互联网企业大数据处理
D、传统企业的数据分析
正确答案B
第34题HDFS的命名空间包含()
A、节点
B、目录
C、文件
D、块
正确答案CD
第35题MapReduce的main函数中设置输出类型的方法有()。
A、setOutputKeyClass
B、setOutputClass
C、setOutputValueClass
D、setKeyValueClass
正确答案C
第36题Hadoop在配置伪分布式时需要修改哪几个配置文件()。
A、hbasesite.xml
B、hdfssite.xml
C、coresite.xml
D、mapsite.xml
E、maprsite.xml
正确答案C
第37题哪些属于数据可视化的重要作用()
A、分析数据
B、采集数据
C、辅助理解数据
D、观测跟踪数据
正确答案
第38题以下哪些是数据可视化时间线工具()
A、Echarts
B、Timetoast
C、Xtimeline
D、R
正确答案
第39题流计算是针对流数据的实时计算可以应用在()场景中
A、广告投放
B、气候模拟预测
C、机器翻译
D、推荐系统
正确答案
第40题传统的数据处理流程的前提是()。
A、存储的数据是旧的
B、存储的数据是实时的
C、需要用户主动发出查询
D、不需要用户主动发出查询
正确答案C
第41题Pig是Hadoop项目中一种数据仓库工具。
T、对
F、错
正确答案F
第42题阿里云RDS中一个实例可以创建多个数据库在实例内数据库命名唯一所有数据库都会共享该实例下的资源如CPU、内存、磁盘容量等
T、对
F、错
第43题HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据
T、对
F、错
正确答案F
第44题Storm框架是实时计算系统所以不能使用数据库。
T、对
F、错
正确答案
第45题关系数据库的关键特性包括完善的事务机制和高效的查询机制
T、对
F、错
第46题大数据计算处理方法主要分为两种方法即批处理方法和流处理方法。
T、对
F、错
正确答案
第47题大数据决策逐渐成为一种新的决策方式大数据应用有力促进了信息技术与各行业的深度融合大数据开发大大推动了新技术和新应用的不断涌现。
T、对
F、错
正确答案
第48题Hbase中缓存刷新每次刷写都生成一个新的StoreFile文件因此每个Store包含多个StoreFile文件
T、对
F、错
第49题在HBase中更新操作会用最新的当前值去替换记录中原来的旧值旧值被覆盖后就不会存在
T、对
F、错
正确答案F
HDFS在设计上采取了多种机制保证在硬件出错的环境中实现数据的完整性。
T、对
F、错
正确答案
本内容由易百教育整理发布
www.openhelp100.com
页:
[1]