南开大学20春学期《大数据开发技术（二）》在线作业（随机）-南开大学-奥鹏易百

易百网 发表于 2020-4-23 13:28:40

南开大学20春学期《大数据开发技术（二）》在线作业（随机）

【奥鹏】[南开大学]20春学期（1709、1803、1809、1903、1909、2003）《大数据开发技术（二）》在线作业
试卷总分100得分100

奥鹏在线作业
联系QQ 515224986
第1题在MLlib中，逻辑回归算法的输入值为（）类型
A、Double
B、LabledPoint
C、Point
D、SGB
正确答案
第2题Scala列表方法中获取列表的第一个元素的方法是（）
A、drop
B、head
C、filter
D、init
正确答案
第3题sparksubmit配置项中（）表示每个executor使用的内核数
A、numexecutorsNUM
B、executormemoryMEM
C、totalexecutorcoresNUM
D、executorcouresNUM
正确答案奥鹏作业答案
联系QQ 515224986
第4题SparkStreming中（）函数当被调用的两个DStream分别含有(KV)和(KW)键值对时返回一个(KSeqSeq)类型的新的DStream。
A、union
B、reduce
C、join
D、cogroup
正确答案
第5题PairRDD可以通过（）获得仅包含键的RDD
A、key
B、keys
C、value
D、values
正确答案
第6题GraphX中（）是完整提供边的各种操作类
A、RDD
B、EdgeRDD
C、RDD[(VertexIdVD)]
D、VertexRDD
正确答案
第7题一般情况下，对于迭代次数较多的应用程序，Spark程序在内存中的运行速度是HadoopMapReduce运行速度的（）多倍
A、2
B、10
C、100
D、1000
正确答案
第8题MLlib中可以调用mllib.tree.DecisionTree类中的静态方法（）训练分类树
A、trainClassifier
B、trainRegressor
C、LogisticRegressionModel
D、LabeledPoint
正确答案
第9题Scala中（）方法返回Map所有的value
A、key
B、keys
C、value
D、values
正确答案
第10题SparkStreming中DStream的每个RDD都是由（）分割开来的数据集
A、分区
B、一小段时间
C、数据量
D、随机
正确答案
第11题Dstream窗口操作中（）方法基于滑动窗口对（K，V）键值对类型的DStream中的值按K使用聚合函数func进行聚合操作，得到一个新的Dstream
A、window
B、countByWindow
C、reduceByWindow
D、reduceByKeyAndWindow
正确答案
第12题Scala列表方法中输出符号指定条件的所有元素的方法是（）
A、drop
B、head
C、filter
D、init
正确答案
第13题以下哪个不是Scala的数据类型（）
A、Int
B、ShortInt
C、Long
D、Any
正确答案
第14题当需要将一个普通的RDD转化为一个PairRDD时可以使用（）函数来进行操作
A、transfer
B、change
C、map
D、build
正确答案
第15题Dstream窗口操作中（）方法返回一个基于源DStream的窗口批次计算后得到新的DStream。
A、window
B、countByWindow
C、reduceByWindow
D、reduceByKeyAndWindow
正确答案
第16题Dstream窗口操作中（）方法基于滑动窗口对源DStream中的元素进行聚合操作，得到一个新的Dstream
A、window
B、countByWindow
C、reduceByWindow
D、reduceByKeyAndWindow
正确答案
第17题Dstream输出操作中（）方法在Driver中打印出DStream中数据的前12个元素。
A、print
B、saveAsTextFiles
C、saveAsObjectFiles
D、saveAsHadoopFiles
正确答案
第18题如果numPartitions是分区个数，那么Spark每个RDD的分区ID范围是（）
A、
B、
C、
D、
正确答案
第19题GraphX中graph.edges可以得到（）
A、顶点视图
B、边视图
C、顶点与边的三元组整体视图
D、有向图
正确答案
第20题GraphX中（）是存放着存放顶点的RDD
A、RDD
B、EdgeRDD
C、RDD[(VertexIdVD)]
D、VertexRDD
正确答案
第21题Scala中（）方法返回一个列表，包含除了第一个元素之外的其他元素
A、head
B、init
C、tail
D、last
正确答案
第22题请问RDD的（）操作把RDD所有元素转换成数组并返回到Driver端
A、join
B、zip
C、combineByKey
D、collect
正确答案
第23题SparkGraphX中类Graph的mapReduceTriplets方法可以（）
A、收集邻居顶点的顶点Id和顶点属性
B、收集邻居顶点的顶点Id
C、向指定顶点发送信息并聚合信息
D、将顶点信息更新到图中
正确答案
第24题Scala列表方法中通过给定的方法将所有元素重新计算的方法是（）
A、filter
B、foreach
C、map
D、mkString
正确答案
第25题Scala列表方法中返回所有元素，除了最后一个的方法是（）
A、drop
B、head
C、filter
D、init
正确答案
第26题Scala中可以用（）方法来连接两个或多个列表
A、
B、#
C、List.)
D、List.concat()
正确答案
第27题SparkDataFrame中（）方法可以返回一个Array对象
A、collect
B、take
C、takeAsList
D、collectAsList
正确答案
第28题Scala系统支持（）作为对象成员
A、通用类
B、内部类
C、抽象类
D、复合类
正确答案
第29题Mllib实现了一些常见的机器学习算法和应用程序，包括（）
A、分类
B、聚类
C、降维
D、回归
正确答案
第30题SparkStreaming能够和（）无缝集成
A、Hadoop
B、SparkSQL
C、Mllib
D、GraphX
正确答案
第31题以下算法中属于分类算法的是（）
A、KNN算法
B、逻辑回归
C、随机森林
D、Kmeans
正确答案
第32题SparkCore包含的功能有（）
A、任务调度
B、内存管理
C、SQL查询
D、容错机制
正确答案
第33题Scala中构造列表的两个基本单位是（）
A、Nil
B、Nill
C、
D、List
正确答案
第34题SparkDataFrame中（）方法可以返回一个List
A、collect
B、take
C、takeAsList
D、collectAsList
正确答案
第35题MLlib中用于线性回归算法的包主要有（）
A、LinearRegressionWithSGD
B、RidgeRegressionWithSGD
C、LassoWithSGD
D、LeftRegression
正确答案
第36题RDD的map操作不会改变RDD的分区数目
T、对
F、错
正确答案
第37题MLlib中StandardScaler处理的对象是每一列，也就是每一维特征，将特征标准化为单位标准差或是0均值，或是0均值单位标准差。
T、对
F、错
正确答案
第38题Scala中高阶函数经常将只需要执行多次的函数定义为匿名函数作为参数
T、对
F、错
正确答案
第39题SparkSQL仅仅包括基本的SQL语法
T、对
F、错
正确答案
第40题聚类是一种无监督学习的方法，用于将高度相似的数据分到一类中
T、对
F、错
正确答案
第41题MLlib由一些通用的学习算法和工具组成，包括分类、回归、聚类、协同过滤、降维等，同时还包括底层的优化原语和高层的管道API。
T、对
F、错
正确答案
第42题SparkGraphX课通过mapVertices(map(VertexIdVD)=VD2)实现对顶点属性经过变换生成新的图
T、对
F、错
正确答案
第43题SparkStreming中对DStream的任何操作都会转化成对底层RDDs的操作
T、对
F、错
正确答案
第44题Scala中默认情况下使用的是可变的Map
T、对
F、错
正确答案
第45题mllib.feature中存在一些常见的特征转化方法，主要包括创建特征向量和标准化数据
T、对
F、错
正确答案
第46题Scala中允许集成多个父类
T、对
F、错
正确答案
第47题RDD中combineByKey不允许返回类型与输入数据类型不同的返回值
T、对
F、错
正确答案
第48题SparkSQL可被视为一个分布式的SQL查询引擎，并且提供了一个叫做DataFrame的可编程抽象数据模型
T、对
F、错
正确答案
第49题SparkGraphX课通过mapTriplets(mapEdgeTriplet=ED2)
实现对边属性经过变换生成新的图
T、对
F、错
正确答案
第50题Scala是ScalableLanguage的简写，是一门多范式的编程语言，设计初衷是不包括函数式编程的特性。
T、对
F、错
正确答案

南开大学

页: [1]

奥鹏易百's Archiver

南开大学20春学期《大数据开发技术（二）》在线作业（随机）