openhelp100 发表于 2022-5-28 07:39:11

南开大学22春学期《数据科学导论》在线作业(活体识别)

22春学期(高起本1709、全层次18032103)《数据科学导论》在线作业
试卷总分100得分100
南开大学2022春季学期在线作业答案
第1题哪一项不属于规范化的方法
A、最小最大规范化
B、零均值规范化
C、小数定标规范化
D、中位数规范化
正确答案
第2题例如将工资收入属性值映射到或者内属于数据变换中的
A、简单函数变换
B、规范化
C、属性构造
D、连续属性离散化
正确答案
第3题Apriori算法的加速过程依赖于以下哪个策略
A、抽样
B、剪枝
C、缓冲
D、并行
正确答案    奥鹏作业答案
第4题以下属于关联分析的是
A、CPU性能预测
B、购物篮分析
C、自动判断鸢尾花类别
D、股票趋势建模
正确答案
在一元线性回归模型中残差项服从分布
A、泊松
B、正态
C、线性
D、非线性
正确答案
第6题以下哪一项不是特征工程的子问题
A、特征创建
B、特征提取
C、特征选择
D、特征识别
正确答案
第7题下面不是分类的常用方法的有
A、K近邻法
B、朴素贝叶斯
C、决策树
D、条件随机场
正确答案
第8题置信度confidence是衡量兴趣度度量的指标
A、简洁性
B、确定性
C、实用性
D、新颖性
正确答案
第9题变量之间的关系一般可以分为确定性关系与
A、非确定性关系
B、线性关系
C、函数关系
D、相关关系
正确答案
以下哪一项不是特征选择常见的方法
A、过滤式
B、封装式
C、嵌入式
D、开放式
正确答案
第11题设X={123}是频繁项集则可由X产生个关联规则
A、4
B、5
C、6
D、7
正确答案
以下哪一项不属于数据变换
A、简单函数变换
B、规范化
C、属性合并
D、连续属性离散化
正确答案
第13题根据映射关系的不同可以分为线性回归和
A、对数回归
B、非线性回归
C、逻辑回归
D、多元回归
正确答案
第14题BFR聚类是用于处理数据集的kmeans变体
A、大
B、中
C、小
D、所有
正确答案
以下哪个不是处理缺失值的方法
A、删除记录
B、按照一定原则补充
C、不处理
D、随意填写
正确答案
第16题维克托?迈尔舍恩伯格在《大数据时代生活、工作与思维的大变革》一书中持续强调了一个观点大数据时代的到来使我们无法人为地去发现数据中的奥妙与此同时我们更应该注重数据中的相关关系而不是因果关系其中数据之间的相关关系可以通过以下哪个算法直接挖掘
A、Kmeans
B、BayesNetwork
C、C4.5
D、Apriori
正确答案
第17题我们需要对已生成的树进行剪枝将树变得简单从而使它具有更好的泛化能力
A、自上而下
B、自下而上
C、自左而右
D、自右而左
正确答案
第18题通过构造新的指标线损率当超出线损率的正常范围则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的
A、简单函数变换
B、规范化
C、属性构造
D、连续属性离散化
正确答案
第19题单层感知机拥有层功能神经元
A、一
B、二
C、三
D、四
正确答案
多层感知机是由层神经元组成
A、二
B、三
C、大于等于二层
D、大于等于三层
正确答案
第21题距离度量中的距离可以是
A、欧式距离
B、曼哈顿距离
C、Lp距离
D、Minkowski距离
正确答案BCD
第22题相关性的分类按照相关的方向可以分为
A、正相关
B、负相关
C、左相关
D、右相关
正确答案B
第23题聚类的主要方法有
A、划分聚类
B、层次聚类
C、密度聚类
D、距离聚类
正确答案BC
第24题数据科学具有哪些性质
A、有效性
B、可用性
C、未预料
D、可理解
正确答案BCD
k近邻法的基本要素包括
A、距离度量
B、k值的选择
C、样本大小
D、分类决策规则
正确答案BD
第26题多层感知机的学习过程包含
A、信号的正向传播
B、信号的反向传播
C、误差的正向传播
D、误差的反向传播
正确答案D
第27题下列选项是BFR的对象是
A、废弃集
B、临时集
C、压缩集
D、留存集
正确答案CD
第28题一元回归参数估计的参数求解方法有
A、最大似然法
B、距估计法
C、最小二乘法
D、欧式距离法
正确答案BC
第29题什么情况下结点不用划分
A、当前结点所包含的样本全属于同一类别
B、当前属性集为空,或是所有样本在所有属性上取值相同
C、当前结点包含的样本集为空
D、还有子集不能被基本正确分类
正确答案BC
Kmeans聚类中K值选取的方法是
A、密度分类法
B、手肘法
C、大腿法
D、随机选取
正确答案B
第31题两个对象越相似他们的相异度就越高
T、对
F、错
正确答案
第32题贝叶斯定理是概率论中的一个结果它与随机变量的条件概率以及联合概率分布有关
T、对
F、错
第33题在一元线性回归中输入只包含一个单独的特征
T、对
F、错
正确答案
第34题在数据预处理时无论什么情况都可以直接将异常值删除
T、对
F、错
正确答案F
第35题茎叶图失去原始数据的信息而直方图保留原始数据的信息
T、对
F、错
正确答案
第36题交叉表可以帮助人们发现变量之间的相互作用
T、对
F、错
正确答案
第37题使用SVD方法进行图像压缩不可以保留图像的重要特征
T、对
F、错
正确答案F
第38题Pearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量
T、对
F、错
第39题平均减少的不纯度越大则特征重要度越高
T、对
F、错
第40题朴素贝叶斯分类器有简单、高效、健壮的特点但某些属性可能会降低分类器的性能
T、对
F、错
正确答案
第41题由不同的距离度量所确定的最近邻点是不同的
T、对
F、错
第42题一般而言信息增益越大则意味着使用属性a来进行划分所获得的纯度提升越大因此我们可用信息增益来进行决策树的最优特征选择
T、对
F、错
第43题决策树内部结点表示一个类叶结点表示一个特征或属性
T、对
F、错
正确答案
第44题剪枝是决策树学习算法对付过拟合的主要手段
T、对
F、错
第45题子集产生本质上是一个搜索过程该过程可以从空集、随机产生的一个特征子集或者整个特征集开始
T、对
F、错
第46题特征的信息增益越大则其越不重要
T、对
F、错
正确答案F
第47题信息熵越大数据信息的不确定性越小
T、对
F、错
正确答案F
第48题利用K近邻法进行分类时使用不同的距离度量所确定的最近邻点都是相同的
T、对
F、错
正确答案F
第49题数据科学可以回答复杂的问题发现世界中隐藏的联系并预测和指导未来
T、对
F、错
正确答案
Kmeans算法采用贪心策略通过迭代优化来近似求解
T、对
F、错

本内容由易百教育整理并发布
页: [1]
查看完整版本: 南开大学22春学期《数据科学导论》在线作业(活体识别)