南开20秋学期《数据科学导论》在线作业(题目随机)(2)
[南开大学]20秋学期(1709、1803、1809、1903、1909、2003、2009)《数据科学导论》在线作业试卷总分100得分100
作业QQ 515224986
答案来源www.openhelp100.com
第1题某商品的产量(X件)与单位成本(Y元/件)之间的回归方程为^Y=1001.2X这说明()。
A、产量每增加一台,单位成本增加100元
B、产量每增加一台,单位成本减少1.2元
C、产量每增加一台,单位成本平均减少1.2元
D、产量每增加一台,单位平均增加100元
正确答案
第2题置信度(confidence)是衡量兴趣度度量()的指标。
A、简洁性
B、确定性
C、实用性
D、新颖性
正确答案
第3题实体识别属于以下哪个过程()
A、数据清洗
B、数据集成
C、数据规约
D、数据变换
正确答案
第4题在一元线性回归模型中残差项服从()分布。
A、泊松
B、正态
C、线性
D、非线性
正确答案
手肘法的核心指标是()。
A、SES
B、SSE
C、RMSE
D、MSE
正确答案
第6题单层感知机模型属于()模型。
A、二分类的线性分类模型
B、二分类的非线性分类模型 答案来源www.openhelp100.com
南开作业QQ 515224986
C、多分类的线性分类模型
D、多分类的非线性分类模型
正确答案
第7题某超市研究销售纪录数据后发现买啤酒的人很大概率也会购买尿布这种属于数据挖掘的哪类问题?()
A、关联规则发现
B、聚类
C、分类
D、自然语言处理
正确答案
第8题下列两个变量之间的关系中哪个是函数关系()。
A、人的性别和他的身高
B、人的工资与年龄
C、正方形的面积和边长
D、温度与湿度
正确答案
第9题聚类是一种()。
A、有监督学习
B、无监督学习
C、强化学习
D、半监督学习
正确答案
以下哪些不是缺失值的影响()
A、数据建模将丢失大量有用信息
B、数据建模的不确定性更加显著
C、对整体总是不产生什么作用
D、包含空值的数据可能会使建模过程陷入混乱,导致异常的输出
正确答案
第11题多层感知机是由()层神经元组成。
A、二
B、三
C、大于等于二层
D、大于等于三层
正确答案
以下哪一项不属于数据变换()
A、简单函数变换
B、规范化
C、属性合并
D、连续属性离散化
正确答案
第13题以下哪一项不是特征工程的子问题()
A、特征创建
B、特征提取
C、特征选择
D、特征识别
正确答案
第14题哪一项不属于规范化的方法()
A、最小最大规范化
B、零均值规范化
C、小数定标规范化
D、中位数规范化
正确答案
在k近邻法中选择较小的k值时学习的"近似误差"会()"估计误差"会()。
A、减小,减小
B、减小,增大
C、增大,减小
D、增大,增大
正确答案
第16题在回归分析中自变量为()因变量为()。
A、离散型变量,离散型变量
B、连续型变量,离散型变量
C、离散型变量,连续型变量
D、连续型变量,连续型变量
正确答案
第17题具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。
A、1线性
B、2线性
C、1非线性
D、2非线性
正确答案
第18题以下属于关联分析的是()
A、CPU性能预测
B、购物篮分析
C、自动判断鸢尾花类别
D、股票趋势建模
正确答案
第19题通过构造新的指标线损率当超出线损率的正常范围则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()
A、简单函数变换
B、规范化
C、属性构造
D、连续属性离散化
正确答案
我们需要对已生成的树()进行剪枝将树变得简单从而使它具有更好的泛化能力。
A、自上而下
B、自下而上
C、自左而右
D、自右而左
正确答案
第21题多层感知机的学习过程包含()。
A、信号的正向传播
B、信号的反向传播
C、误差的正向传播
D、误差的反向传播
正确答案D
第22题下面例子属于分类的是()
A、检测图像中是否有人脸出现
B、对客户按照贷款风险大小进行分类
C、识别手写的数字
D、估计商场客流量
正确答案BC
第23题距离度量中的距离可以是()
A、欧式距离
B、曼哈顿距离
C、Lp距离
D、Minkowski距离
正确答案BCD
第24题Apriori算法的计算复杂度受()影响。
A、支持度阈值
B、项数
C、事务数
D、事务平均宽度
正确答案BCD
下列选项是BFR的对象是()
A、废弃集
B、临时集
C、压缩集
D、留存集
正确答案CD
第26题系统日志收集的基本特征有()
A、高可用性
B、高可靠性
C、可扩展性
D、高效率
正确答案BC
第27题一元回归参数估计的参数求解方法有()。
A、最大似然法
B、距估计法
C、最小二乘法
D、欧式距离法
正确答案BC
第28题k近邻法的基本要素包括()。
A、距离度量
B、k值的选择
C、样本大小
D、分类决策规则
正确答案BD
第29题Kmeans聚类中K值选取的方法是()。
A、密度分类法
B、手肘法
C、大腿法
D、随机选取
正确答案B
聚类的主要方法有()。
A、划分聚类
B、层次聚类
C、密度聚类
D、距离聚类
正确答案BC
第31题决策树分类时将该结点的实例强行分到条件概率大的那一类去
T、对
F、错
第32题获取数据为数据分析提供了素材和依据这里的数据只包括直接获取的数据。
T、对
F、错
正确答案F
第33题阶跃函数具有不光滑、不连续的特点。
T、对
F、错
第34题sigmoid函数属于阶跃函数是神经网络中常见的激活函数。
T、对
F、错
正确答案F
第35题选择较小的k值相当于用较小的邻域中的训练实例进行预测学习的"近似误差"会减小"估计误差"会增大预测结果会对近邻的点实例点非常敏感。
T、对
F、错
第36题子集产生本质上是一个搜索过程该过程可以从空集、随机产生的一个特征子集或者整个特征集开始。
T、对
F、错
第37题决策树内部结点表示一个类叶结点表示一个特征或属性
T、对
F、错
正确答案F
第38题朴素贝叶斯分类器有简单、高效、健壮的特点但某些属性可能会降低分类器的性能
T、对
F、错
第39题信息熵越小样本结合的纯度越低
T、对
F、错
正确答案F
第40题决策树学习的算法通常是一个递归地选择最优特征并根据该特征对训练数据进行分割使得各个子数据集有一个最好的分类的过程这一过程对应着特征空间的划分也对应着决策树的构建
T、对
F、错
第41题当维度增加时特征空间的体积增加得很快使得可用的数据变得稠密。
T、对
F、错
正确答案F
第42题数据分析师的任务用模型来回答具体问题了解数据其来源和结构
T、对
F、错
正确答案F
第43题集中趋势能够表明在一定条件下数据的独特性质与差异
T、对
F、错
正确答案F
第44题对于分类数据经常使用表格来统计各种类别的数据出现的频率。
T、对
F、错
第45题一般而言信息增益越大则意味着使用属性a来进行划分所获得的"纯度提升越大"因此我们可用信息增益来进行决策树的最优特征选择。
T、对
F、错
第46题关联规则可以被广泛地应用于通信、金融、交通、健康医疗和Web用户行为分析等领域。
T、对
F、错
第47题当训练集较大的时候标准BP算法通常会更快的获得更好的解。
T、对
F、错
第48题增加神经元的个数无法提高神经网络的训练精度。
T、对
F、错
正确答案F
第49题Kmeans算法采用贪心策略通过迭代优化来近似求解。
T、对
F、错
使用SVD方法进行图像压缩不可以保留图像的重要特征。
T、对
F、错
正确答案F
答案来源www.openhelp100.com
QQ 515224986
页:
[1]