南开大学20春学期《数据科学导论》在线作业1(随机)
【奥鹏】[南开大学(本部)]20春学期(1709、1803、1809、1903、1909、2003)《数据科学导论》在线作业试卷总分100得分100
奥鹏作业答案
联系QQ 515224986
第1题单层感知机是由()层神经元组成。
A、一
B、二
C、三
D、四
正确答案
第2题多层感知机是由()层神经元组成。
A、二
B、三
C、大于等于二层
D、大于等于三层
正确答案
第3题在k近邻法中选择较小的k值时学习的“近似误差”会()“估计误差”会()。
A、减小,减小
B、减小,增大
C、增大,减小
D、增大,增大
正确答案 南开大学
奥鹏作业答案联系QQ 515224986
第4题通过变量标准化计算得到的回归方程称为()。
A、标准化回归方程
B、标准化偏回归方程
C、标准化自回归方程
D、标准化多回归方程
正确答案
第5题设X={123}是频繁项集则可由X产生()个关联规则。
A、4
B、5
C、6
D、7
正确答案
第6题维克托?迈尔舍恩伯格在《大数据时代生活、工作与思维的大变革》一书中持续强调了一个观点大数据时代的到来使我们无法人为地去发现数据中的奥妙与此同时我们更应该注重数据中的相关关系而不是因果关系。其中数据之间的相关关系可以通过以下哪个算法直接挖掘()
A、Kmeans
B、BayesNetwork
C、C4.5
D、Apriori
正确答案
第7题置信度(confidence)是衡量兴趣度度量()的指标。
A、简洁性
B、确定性
C、实用性
D、新颖性
正确答案
第8题以下哪一项不属于数据变换()
A、简单函数变换
B、规范化
C、属性合并
D、连续属性离散化
正确答案
第9题某超市研究销售纪录数据后发现买啤酒的人很大概率也会购买尿布这种属于数据挖掘的哪类问题?()
A、关联规则发现
B、聚类
C、分类
D、自然语言处理
正确答案
第10题实体识别属于以下哪个过程()
A、数据清洗
B、数据集成
C、数据规约
D、数据变换
正确答案
第11题Apriori算法的加速过程依赖于以下哪个策略()
A、抽样
B、剪枝
C、缓冲
D、并行
正确答案
第12题手肘法的核心指标是()。
A、SES
B、SSE
C、RMSE
D、MSE
正确答案
第13题考虑下面的频繁3项集的集合{123}{124}{125}{134}{135}{234}{235}{345}假定数据集中只有5个项采用合并策略由候选产生过程得到4项集不包含()
A、1234
B、1235
C、1245
D、1345
正确答案
第14题层次聚类对给定的数据进行()的分解。
A、聚合
B、层次
C、分拆
D、复制
正确答案
第15题层次聚类适合规模较()的数据集
A、大
B、中
C、小
D、所有
正确答案
第16题通过构造新的指标线损率当超出线损率的正常范围则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()
A、简单函数变换
B、规范化
C、属性构造
D、连续属性离散化
正确答案
第17题BFR聚类是用于处理数据集()的kmeans变体。
A、大
B、中
C、小
D、所有
正确答案
第18题为了解决任何复杂的分类问题使用的感知机结构应至少包含()个隐含层。
A、1
B、2
C、3
D、4
正确答案
第19题对于k近邻法下列说法错误的是()。
A、不具有显式的学习过程
B、适用于多分类任务
C、k值越大,分类效果越好
D、通常采用多数表决的分类决策规则
正确答案
第20题在回归分析中自变量为()因变量为()。
A、离散型变量,离散型变量
B、连续型变量,离散型变量
C、离散型变量,连续型变量
D、连续型变量,连续型变量
正确答案
第21题数据科学具有哪些性质()
A、有效性
B、可用性
C、未预料
D、可理解
正确答案
第22题下列选项是BFR的对象是()
A、废弃集
B、临时集
C、压缩集
D、留存集
正确答案
第23题多层感知机的学习过程包含()。
A、信号的正向传播
B、信号的反向传播
C、误差的正向传播
D、误差的反向传播
正确答案
第24题Apriori算法的计算复杂度受()影响。
A、支持度阈值
B、项数
C、事务数
D、事务平均宽度
正确答案
第25题距离度量中的距离可以是()
A、欧式距离
B、曼哈顿距离
C、Lp距离
D、Minkowski距离
正确答案
第26题什么情况下结点不用划分()
A、当前结点所包含的样本全属于同一类别
B、当前属性集为空,或是所有样本在所有属性上取值相同
C、当前结点包含的样本集为空
D、还有子集不能被基本正确分类
正确答案
第27题Kmeans聚类中K值选取的方法是()。
A、密度分类法
B、手肘法
C、大腿法
D、随机选取
正确答案
第28题对于多层感知机()层拥有激活函数的功能神经元。
A、输入层
B、隐含层
C、输出层
正确答案
第29题相关性的分类按照相关的方向可以分为()。
A、正相关
B、负相关
C、左相关
D、右相关
正确答案
第30题聚类的主要方法有()。
A、划分聚类
B、层次聚类
C、密度聚类
D、距离聚类
正确答案
第31题利用K近邻法进行分类时k值过小容易发生过拟合现象。
T、对
F、错
正确答案
第32题Apriori算法是一种典型的关联规则挖掘算法。
T、对
F、错
正确答案
第33题贝叶斯定理是概率论中的一个结果它与随机变量的条件概率以及联合概率分布有关。
T、对
F、错
正确答案
第34题可信度是对关联规则的准确度的衡量。
T、对
F、错
正确答案
第35题利用K近邻法进行分类时使用不同的距离度量所确定的最近邻点都是相同的。
T、对
F、错
正确答案
第36题k值增大意味着整体模型变得复杂。
T、对
F、错
正确答案
第37题获取数据为数据分析提供了素材和依据这里的数据只包括直接获取的数据。
T、对
F、错
正确答案
第38题决策树还可以表示给定特征条件下类的条件概率分布这一概率分布定义在特征空间的一个划分上将特征空间分为互不相交的单元或区域并在每个单元定义一个类的概率分布就构成了一个条件概率分布
T、对
F、错
正确答案
第39题探索性数据分析的特点是研究从原始数据入手完全以实际数据为依据。
T、对
F、错
正确答案
第40题当特征为离散型时可以使用信息增益作为评价统计量。
T、对
F、错
正确答案
第41题信息熵越大数据信息的不确定性越小。
T、对
F、错
正确答案
第42题决策树内部结点表示一个类叶结点表示一个特征或属性
T、对
F、错
正确答案
第43题给定一个数据集如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧则称该数据集是线性可分数据集。
T、对
F、错
正确答案
第44题不满足给定评价度量的关联规则是无趣的。
T、对
F、错
正确答案
第45题集中趋势能够表明在一定条件下数据的独特性质与差异
T、对
F、错
正确答案
第46题随着特征维数的增加样本间区分度提高。
T、对
F、错
正确答案
第47题多元线性回归模型中标准化偏回归系数没有单位。
T、对
F、错
正确答案
第48题交叉表被广泛用于调查研究商业智能工程和科学研究
T、对
F、错
正确答案
第49题具有双隐层的感知机足以用于解决任何复杂的分类问题。
T、对
F、错
正确答案
第50题标准BP算法是在读取全部数据集后对参数进行统一更新的算法。
T、对
F、错
正确答案
南开大学
奥鹏作业答案联系QQ 515224986
页:
[1]