南开20秋学期《数据科学导论》在线作业(题目随机)
[南开大学(本部)]20秋学期(1709、1803、1809、1903、1909、2003、2009)《数据科学导论》在线作业试卷总分100得分100
QQ 515224986
答案来源www.openhelp100.com
第1题以下哪一项不是特征选择常见的方法()
A、过滤式
B、封装式
C、嵌入式
D、开放式
正确答案
第2题利用最小二乘法对多元线性回归进行参数估计时其目标为()。
A、最小化方差#最小化标准差
B、最小化残差平方和
C、最大化信息熵
正确答案
第3题以下哪些不是缺失值的影响()
A、数据建模将丢失大量有用信息
B、数据建模的不确定性更加显著
C、对整体总是不产生什么作用
D、包含空值的数据可能会使建模过程陷入混乱,导致异常的输出
正确答案
第4题下列两个变量之间的关系中哪个是函数关系()。
A、人的性别和他的身高
B、人的工资与年龄
C、正方形的面积和边长
D、温度与湿度
正确答案 答案来源www.openhelp100.com
南开作业QQ 515224986
哪一项不属于规范化的方法()
A、最小最大规范化
B、零均值规范化
C、小数定标规范化
D、中位数规范化
正确答案
第6题某超市研究销售纪录数据后发现买啤酒的人很大概率也会购买尿布这种属于数据挖掘的哪类问题?()
A、关联规则发现
B、聚类
C、分类
D、自然语言处理
正确答案
第7题考虑下面的频繁3项集的集合{123}{124}{125}{134}{135}{234}{235}{345}假定数据集中只有5个项采用合并策略由候选产生过程得到4项集不包含()
A、1234
B、1235
C、1245
D、1345
正确答案
第8题为了解决任何复杂的分类问题使用的感知机结构应至少包含()个隐含层。
A、1
B、2
C、3
D、4
正确答案
第9题设X={123}是频繁项集则可由X产生()个关联规则。
A、4
B、5
C、6
D、7
正确答案
以下哪一项不属于数据变换()
A、简单函数变换
B、规范化
C、属性合并
D、连续属性离散化
正确答案
第11题一元线性回归中真实值与预测值的差称为样本的()。
A、误差
B、方差
C、测差
D、残差
正确答案
聚类的最简单最基本方法是()。
A、划分聚类
B、层次聚类
C、密度聚类
D、距离聚类
正确答案
第13题单层感知机模型属于()模型。
A、二分类的线性分类模型
B、二分类的非线性分类模型
C、多分类的线性分类模型
D、多分类的非线性分类模型
正确答案
第14题在一元线性回归中通过最小二乘法求得的直线叫做回归直线或()。
A、最优回归线
B、最优分布线
C、最优预测线
D、最佳分布线
正确答案
在k近邻法中选择较小的k值时学习的"近似误差"会()"估计误差"会()。
A、减小,减小
B、减小,增大
C、增大,减小
D、增大,增大
正确答案
第16题某商品的产量(X件)与单位成本(Y元/件)之间的回归方程为^Y=1001.2X这说明()。
A、产量每增加一台,单位成本增加100元
B、产量每增加一台,单位成本减少1.2元
C、产量每增加一台,单位成本平均减少1.2元
D、产量每增加一台,单位平均增加100元
正确答案
第17题对于k近邻法下列说法错误的是()。
A、不具有显式的学习过程
B、适用于多分类任务
C、k值越大,分类效果越好
D、通常采用多数表决的分类决策规则
正确答案
第18题实体识别属于以下哪个过程()
A、数据清洗
B、数据集成
C、数据规约
D、数据变换
正确答案
第19题在回归分析中自变量为()因变量为()。
A、离散型变量,离散型变量
B、连续型变量,离散型变量
C、离散型变量,连续型变量
D、连续型变量,连续型变量
正确答案
在有统计学意义的前提下标准化偏回归系数的绝对值越大说明相应的自变量对y的作用()。
A、越小
B、越大
C、无关
D、不确定
正确答案
第21题Kmeans聚类中K值选取的方法是()。
A、密度分类法
B、手肘法
C、大腿法
D、随机选取
正确答案B
第22题系统日志收集的基本特征有()
A、高可用性
B、高可靠性
C、可扩展性
D、高效率
正确答案BC
第23题Apriori算法的计算复杂度受()影响。
A、支持度阈值
B、项数
C、事务数
D、事务平均宽度
正确答案BCD
第24题距离度量中的距离可以是()
A、欧式距离
B、曼哈顿距离
C、Lp距离
D、Minkowski距离
正确答案BCD
k近邻法的基本要素包括()。
A、距离度量
B、k值的选择
C、样本大小
D、分类决策规则
正确答案BD
第26题多层感知机的学习过程包含()。
A、信号的正向传播
B、信号的反向传播
C、误差的正向传播
D、误差的反向传播
正确答案D
第27题一元回归参数估计的参数求解方法有()。
A、最大似然法
B、距估计法
C、最小二乘法
D、欧式距离法
正确答案BC
第28题什么情况下结点不用划分()
A、当前结点所包含的样本全属于同一类别
B、当前属性集为空,或是所有样本在所有属性上取值相同
C、当前结点包含的样本集为空
D、还有子集不能被基本正确分类
正确答案BC
第29题数据科学具有哪些性质()
A、有效性
B、可用性
C、未预料
D、可理解
正确答案BCD
下面例子属于分类的是()
A、检测图像中是否有人脸出现
B、对客户按照贷款风险大小进行分类
C、识别手写的数字
D、估计商场客流量
正确答案BC
第31题剪枝是决策树学习算法对付"过拟合"的主要手段
T、对
F、错
第32题给定一组点使用点之间的距离概念将点分组为若干簇不同簇的成员可以相同。
T、对
F、错
正确答案F
第33题相关性分析主要是分析个别独立变量之间线性相关程度的强弱并用适当的统计指标表示出来的过程。
T、对
F、错
正确答案F
第34题分拆方法是自底向上的方法。
T、对
F、错
正确答案
第35题探索性数据分析的特点是研究从原始数据入手完全以实际数据为依据。
T、对
F、错
第36题在数据预处理时无论什么情况都可以直接将异常值删除
T、对
F、错
正确答案F
第37题对于项集来说置信度没有意义。
T、对
F、错
第38题给定关联规则A→B意味着若A发生B也会发生。
T、对
F、错
正确答案F
第39题信息熵越小样本结合的纯度越低
T、对
F、错
正确答案F
第40题聚合方法是自底向上的方法。
T、对
F、错
第41题BFR聚类簇的坐标可以与空间的坐标保持一致。
T、对
F、错
正确答案F
第42题集中趋势能够表明在一定条件下数据的独特性质与差异
T、对
F、错
正确答案F
第43题利用K近邻法进行分类时使用不同的距离度量所确定的最近邻点都是相同的。
T、对
F、错
正确答案F
第44题朴素贝叶斯分类器有简单、高效、健壮的特点但某些属性可能会降低分类器的性能
T、对
F、错
第45题数据科学运用科学方法分析数据位于几个学科的交叉点并利用领域特定的知识使大数据的分析成为可能。
T、对
F、错
正确答案
第46题使用SVD方法进行图像压缩不可以保留图像的重要特征。
T、对
F、错
正确答案F
第47题K均值(KMeans)算法是密度聚类。
T、对
F、错
正确答案F
第48题Kmeans算法采用贪心策略通过迭代优化来近似求解。
T、对
F、错
第49题获取数据为数据分析提供了素材和依据这里的数据只包括直接获取的数据。
T、对
F、错
正确答案F
特征的信息增益越大则其越不重要。
T、对
F、错
正确答案F
答案来源www.openhelp100.com
QQ 515224986
页:
[1]