奥鹏易百

 找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

帮助中心知识拓展客服QQ 515224986
查看: 738|回复: 0

南开20秋学期《大数据开发技术(二)》在线作业(题目随机)

[复制链接]

1万

主题

1

回帖

2万

积分

论坛元老

积分
29028
发表于 2020-10-26 21:23:41 | 显示全部楼层 |阅读模式
扫码加微信
[南开大学]20秋学期(1709、1803、1809、1903、1909、2003、2009)《大数据开发技术(二)》在线作业
试卷总分100得分100
作业QQ515224986
答案来源www.openhelp100.com
第1题可以解决图计算问题
A、SparkCore
B、BlinkDB
C、GraphX
D、Mllib
正确答案
第2题图结构中如果无重复的边或者顶点到自身的边,那么称之为
A、完全图
B、有向完全图
C、无向图
D、简单图
正确答案
第3题是Spark的核心,提供底层框架及核心支持
A、SparkCore
B、SparkSQL
C、SparkStreaming
D、Mllib
正确答案
第4题递归函数意味着函数可以调用它
A、其他函数
B、主函数
C、子函数
D、自身
正确答案
请问RDD的操作是根据键对两个RDD进行内连接
A、join
B、zip
C、combineByKey
D、collect
正确答案
第6题Dstream窗口操作中方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的Dstream
A、window
B、countByWindow    答案来源www.openhelp100.com
作业QQ515224986
C、reduceByWindow
D、reduceByKeyAndWindow
正确答案
第7题SparkStreming中函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream时,返回类型为(K,(V,W))键值对的一个新DStream。
A、union
B、reduce
C、join
D、cogroup
正确答案
第8题SparkStreming中函数可以对源DStream的每个元素通过函数func返回一个新的DStream
A、map
B、flatMap
C、filter
D、union
正确答案
第9题请问RDD的操作用于将相同键的数据聚合
A、join
B、zip
C、combineByKey
D、collect
正确答案
RDD的操作通常用来划分单词
A、filter
B、union
C、flatmap
D、mapPartitions
正确答案
第11题Scala通过来定义变量
A、val
B、val
C、define
D、def
正确答案B
下列Scala代码应输出:
vara=0varb=0varsum=0for(a1until3b1until3){sum+=a+b}println(sum)
A、36
B、35
C、11
D、12
正确答案
第13题MLlib中可以调用mllib.tree.DecisionTree类中的静态方法训练回归树
A、trainClassifier
B、trainRegressor
C、LogisticRegressionModel
D、LabeledPoint
正确答案
第14题以下哪个不是Scala的数据类型
A、AnyRef
B、Anything
C、NULL
D、Nothing
正确答案
SparkGraphX中类Graph的reverse方法可以
A、反转图中所有边的方向
B、按照设定条件取出子图
C、取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性
D、合并边相同的属性
正确答案
第16题图结构中如果任意两个顶点之间都存在边,那么称之为
A、完全图
B、有向完全图
C、无向图
D、简单图
正确答案
第17题Graph类中如果根据边数据创建图,数据需要转换成RDD[Edge[ED]类型,应该用方法
A、Graph(verticesedgesdefaultVertexAttr)
B、Graph.fromEdges(RDD[Edge[ED]]defaultValue)
C、Graph.fromEdgeTuples(rawEdgesRDD[(VertexIdVertexId)]defaultValue)
D、GraphLoader.edgeListFile(scfilename)
正确答案
第18题sparksubmit配置项中表示启动的executor数量
A、numexecutorsNUM
B、executormemoryMEM
C、totalexecutorcoresNUM
D、executorcouresNUM
正确答案
第19题以下算法中属于无监督学习算法的是
A、KNN算法
B、逻辑回归
C、随机森林
D、Kmeans
正确答案
Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是
A、filter
B、flatten
C、grouby
D、flatmap
正确答案
第21题以下哪个函数可以求两个RDD差集
A、union
B、substract
C、intersection
D、cartesian
正确答案
第22题Scala列表方法中通过给定的方法将所有元素重新计算的方法是
A、filter
B、foreach
C、map
D、mkString
正确答案
第23题Graph类中如果要根据边数据创建图,边数据需要加载为二元组,可以选择是否对边分区,应该用方法
A、Graph(verticesedgesdefaultVertexAttr)
B、Graph.fromEdges(RDD[Edge[ED]]defaultValue)
C、Graph.fromEdgeTuples(rawEdgesRDD[(VertexIdVertexId)]defaultValue)
D、GraphLoader.edgeListFile(scfilename)
正确答案
第24题以下哪个函数可以求两个RDD交集
A、union
B、substract
C、intersection
D、cartesian
正确答案
是Spark的数据挖掘算法库
A、SparkCore
B、BlinkDB
C、GraphX
D、Mllib
正确答案
第26题Scala中使用方法来查看两个集合的交集元素
A、Set.concat
B、Set.&amp
C、Set.&amp&amp
D、Set.intersect
正确答案
第27题以下哪个方法可以从集合中创建RDD
A、parallelize
B、makeRDD
C、textFile
D、loadFile
正确答案B
第28题以下是机器学习的常用算法的是
A、回归算法
B、聚类算法
C、降维算法
D、分类算法
正确答案
第29题Mllib实现了一些常见的机器学习算法和应用程序,包括
A、分类
B、聚类
C、降维
D、回归
正确答案BCD
Spark是一个计算框架
A、快速
B、分布式
C、可扩展
D、容错
正确答案
第31题MapReudce不适合任务
A、大数据计算
B、迭代
C、交互式
D、离线分析
正确答案
第32题Spark创建DataFrame对象方式有
A、结构化数据文件
B、外部数据库
C、RDD
D、Hive中的表
正确答案BCD
第33题Spark的RDD持久化操作有()方式
A、cache
B、presist
C、storage
D、long
正确答案B
第34题以下哪个是Scala的数据类型
A、Any
B、NULL
C、Nothing
D、AnyRef
正确答案BCD
第35题Spark中DataFrame的方法是查询指定字段的数据信息
A、select
B、selectExpr
C、col
D、apply
正确答案BCD
第36题RDD的subtract用于用于将前一个RDD中在后一个RDD出现的元素删除
T、对
F、错
第37题RDD的map操作不会改变RDD的分区数目
T、对
F、错
第38题RDD的sortBy函数包含参数numPartitions,该参数决定排序后的RDD的分区个数,默认排序后的分区个数和排序之前的个数相等,即为this.partitions.size。
T、对
F、错
第39题Scala是一种纯面向对象的语言,每个值都是对象。
T、对
F、错
正确答案
第40题MLlib中Normalizer是一个转换器,它可以将多行向量输入转化为统一的形式。
T、对
F、错
正确答案
第41题PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作
T、对
F、错
正确答案
第42题RDD的filter过滤会将返回值为true的过滤掉
T、对
F、错
正确答案F
第43题Scala是ScalableLanguage的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。
T、对
F、错
正确答案
第44题Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素
T、对
F、错
正确答案
第45题Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值
T、对
F、错
正确答案
第46题Scala在子类中重写超类的抽象方法时,需要使用override关键字
T、对
F、错
正确答案
第47题RDD是一个可读写的数据结构
T、对
F、错
正确答案
第48题Scala中创建一个方法时经常用void表示该方法无返回值
T、对
F、错
正确答案
第49题RDD中的collect函数是一个行动操作,把RDD所有元素转换成数组并返回到Driver端,适用于大数据处理后的返回。
T、对
F、错
正确答案
SparkStreming中Dstream是一种抽象的离散流
T、对
F、错
正确答案

答案来源www.openhelp100.com
QQ515224986
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|www.openhelp100.com ( 冀ICP备19026749号-1 )

GMT+8, 2024-11-25 00:54

Powered by openhelp100 X3.5

Copyright © 2001-2024 5u.studio.

快速回复 返回顶部 返回列表