奥鹏易百

 找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

帮助中心知识拓展客服QQ 515224986
查看: 472|回复: 0

南开(本)21春学期《数据科学导论》在线作业(随机题目)

[复制链接]

1万

主题

5

回帖

2万

积分

论坛元老

积分
28878
发表于 2021-8-2 13:12:09 | 显示全部楼层 |阅读模式
扫码加微信
21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《数据科学导论》在线作业
试卷总分100得分100
南开大学
第1题BFR聚类是用于处理数据集()的kmeans变体。
A、大
B、中
C、小
D、所有
正确答案
第2题考虑下面的频繁3项集的集合{123}{124}{125}{134}{135}{234}{235}{345}假定数据集中只有5个项采用合并策略由候选产生过程得到4项集不包含()
A、1234
B、1235
C、1245
D、1345
正确答案
第3题以下哪一项不是特征选择常见的方法()
A、过滤式
B、封装式
C、嵌入式
D、开放式
正确答案
第4题例如将工资收入属性值映射到[11]或者[01]内属于数据变换中的()
A、简单函数变换
B、规范化
C、属性构造
D、连续属性离散化
正确答案
对于k近邻法下列说法错误的是()。
A、不具有显式的学习过程
B、适用于多分类任务
C、k值越大,分类效果越好
D、通常采用多数表决的分类决策规则
正确答案
第6题手肘法的核心指标是()。
A、SES
B、SSE    奥鹏21春在线作业
C、RMSE
D、MSE
正确答案
第7题在k近邻法中选择较小的k值时学习的近似误差会()估计误差会()。
A、减小,减小
B、减小,增大
C、增大,减小
D、增大,增大
正确答案
第8题变量之间的关系一般可以分为确定性关系与()。
A、非确定性关系
B、线性关系
C、函数关系
D、相关关系
正确答案
第9题某商品的产量(X件)与单位成本(Y元/件)之间的回归方程为^Y=1001.2X这说明()。
A、产量每增加一台,单位成本增加100元
B、产量每增加一台,单位成本减少1.2元
C、产量每增加一台,单位成本平均减少1.2元
D、产量每增加一台,单位平均增加100元
正确答案
层次聚类对给定的数据进行()的分解。
A、聚合
B、层次
C、分拆
D、复制
正确答案
第11题下列两个变量之间的关系中哪个是函数关系()。
A、人的性别和他的身高
B、人的工资与年龄
C、正方形的面积和边长
D、温度与湿度
正确答案
通过变量标准化计算得到的回归方程称为()。
A、标准化回归方程
B、标准化偏回归方程
C、标准化自回归方程
D、标准化多回归方程
正确答案
第13题以下属于关联分析的是()
A、CPU性能预测
B、购物篮分析
C、自动判断鸢尾花类别
D、股票趋势建模
正确答案
第14题单层感知机模型属于()模型。
A、二分类的线性分类模型
B、二分类的非线性分类模型
C、多分类的线性分类模型
D、多分类的非线性分类模型
正确答案
以下哪一项不属于数据变换()
A、简单函数变换
B、规范化
C、属性合并
D、连续属性离散化
正确答案
第16题层次聚类适合规模较()的数据集
A、大
B、中
C、小
D、所有
正确答案
第17题维克托?迈尔舍恩伯格在《大数据时代生活、工作与思维的大变革》一书中持续强调了一个观点大数据时代的到来使我们无法人为地去发现数据中的奥妙与此同时我们更应该注重数据中的相关关系而不是因果关系。其中数据之间的相关关系可以通过以下哪个算法直接挖掘()
A、Kmeans
B、BayesNetwork
C、C4.5
D、Apriori
正确答案
第18题根据映射关系的不同可以分为线性回归和()。
A、对数回归
B、非线性回归
C、逻辑回归
D、多元回归
正确答案
第19题数据质量检验的主要任务就是检查原始数据中是否存在脏数据概括性来说脏数据不包括以下()
A、普通值
B、异常值
C、不一致的值
D、重复值
正确答案
在一元线性回归中通过最小二乘法求得的直线叫做回归直线或()。
A、最优回归线
B、最优分布线
C、最优预测线
D、最佳分布线
正确答案
第21题层次聚类的方法是()
A、聚合方法
B、分拆方法
C、组合方法
D、比较方法
正确答案B
第22题k近邻法的基本要素包括()。
A、距离度量
B、k值的选择
C、样本大小
D、分类决策规则
正确答案BD
第23题对于多层感知机()层拥有激活函数的功能神经元。
A、输入层
B、隐含层
C、输出层
正确答案C
第24题Apriori算法的计算复杂度受()影响。
A、支持度阈值
B、项数
C、事务数
D、事务平均宽度
正确答案BCD
系统日志收集的基本特征有()
A、高可用性
B、高可靠性
C、可扩展性
D、高效率
正确答案BC
第26题Kmeans聚类中K值选取的方法是()。
A、密度分类法
B、手肘法
C、大腿法
D、随机选取
正确答案B
第27题多层感知机的学习过程包含()。
A、信号的正向传播
B、信号的反向传播
C、误差的正向传播
D、误差的反向传播
正确答案D
第28题什么情况下结点不用划分()
A、当前结点所包含的样本全属于同一类别
B、当前属性集为空,或是所有样本在所有属性上取值相同
C、当前结点包含的样本集为空
D、还有子集不能被基本正确分类
正确答案BC
第29题下面例子属于分类的是()
A、检测图像中是否有人脸出现
B、对客户按照贷款风险大小进行分类
C、识别手写的数字
D、估计商场客流量
正确答案BC
距离度量中的距离可以是()
A、欧式距离
B、曼哈顿距离
C、Lp距离
D、Minkowski距离
正确答案BCD
第31题增加神经元的个数无法提高神经网络的训练精度。
T、对
F、错
正确答案F
第32题一个人的身高与体重之间具有函数关系。
T、对
F、错
正确答案F
第33题可信度是对关联规则的准确度的衡量。
T、对
F、错
第34题给定一组点使用点之间的距离概念将点分组为若干簇不同簇的成员可以相同。
T、对
F、错
正确答案F
第35题K均值(KMeans)算法是密度聚类。
T、对
F、错
正确答案F
第36题具有双隐层的感知机足以用于解决任何复杂的分类问题。
T、对
F、错
第37题当维度增加时特征空间的体积增加得很快使得可用的数据变得稠密。
T、对
F、错
正确答案F
第38题集中趋势能够表明在一定条件下数据的独特性质与差异
T、对
F、错
正确答案F
第39题给定关联规则A→B意味着若A发生B也会发生。
T、对
F、错
正确答案F
第40题数据科学运用科学方法分析数据位于几个学科的交叉点并利用领域特定的知识使大数据的分析成为可能。
T、对
F、错
第41题BFR聚类簇的坐标可以与空间的坐标保持一致。
T、对
F、错
正确答案F
第42题剪枝是决策树学习算法对付过拟合的主要手段
T、对
F、错
第43题决策树还可以表示给定特征条件下类的条件概率分布这一概率分布定义在特征空间的一个划分上将特征空间分为互不相交的单元或区域并在每个单元定义一个类的概率分布就构成了一个条件概率分布
T、对
F、错
第44题Kmeans聚类是发现给定数据集的K个簇的算法。
T、对
F、错
第45题数据分析师的任务用模型来回答具体问题了解数据其来源和结构
T、对
F、错
正确答案F
第46题特征的信息增益越大则其越不重要。
T、对
F、错
正确答案F
第47题贝叶斯定理是概率论中的一个结果它与随机变量的条件概率以及联合概率分布有关。
T、对
F、错
第48题给定一个数据集如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧则称该数据集是线性可分数据集。
T、对
F、错
正确答案F
第49题对于分类数据经常使用表格来统计各种类别的数据出现的频率。
T、对
F、错
利用K近邻法进行分类时使用不同的距离度量所确定的最近邻点都是相同的。
T、对
F、错
正确答案F

本内容由易百教育整理发布
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|www.openhelp100.com ( 冀ICP备19026749号-1 )

GMT+8, 2024-11-27 12:47

Powered by openhelp100 X3.5

Copyright © 2001-2024 5u.studio.

快速回复 返回顶部 返回列表