南开大学22春学期《大数据导论》在线作业(活体识别)
22春学期(高起本1709、全层次18032103)《大数据导论》在线作业试卷总分100得分100
南开大学2022春季学期在线作业需要面部识别才能进入答题界面
第1题医疗健康数据的基本情况不包括以下哪项
A、诊疗数据
B、个人健康管理数据
C、公共安全数据
D、健康档案数据
正确答案
第2题哪个选项不属于大数据4V特点
A、Volume
B、Valid
C、Variety
D、Value
正确答案
第3题数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段
A、运营式系统阶段
B、用户原创内容阶段
C、感知式系统阶段
正确答案
第4题数据仓库是随着时间变化的下列不正确的是 奥鹏作业答案
A、数据仓库随时间变化不断增加新内容
B、捕捉到的新数据会覆盖原来的快照
C、数据仓库随事件变化不断删去旧的数据内容
D、数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
正确答案
用于描述相等时间间隔下连续数据随时间变化趋势的是
A、折线图
B、散点图
C、条形图
D、饼图
正确答案
第6题第一个提出大数据概念的公司是
A、麦肯锡公司
B、谷歌公司
C、微软公司
D、脸谱公司
正确答案
第7题大数据的最显著特征是
A、数据规模大
B、数据类型多样
C、数据处理速度快
D、数据价值密度高
正确答案
第8题MapReduce中的Map和Reduce函数使用进行输入输出
A、key/value对
B、随机数值
C、其他计算结果
正确答案
第9题用于描述数据分散情况的是
A、分布图
B、箱式图
C、饼图
D、折线图
正确答案
SAN是一种
A、存储设备
B、专为数据存储而设计构建的网络
C、光纤交换机
D、HBA
正确答案
第11题下列哪个工具常用来开发移动友好地交互地图
A、Leaflet
B、Visual.ly
C、BPizzaPieCharts
D、Gephi
正确答案
下列不属于商业大数据类型的是
A、传统企业数据
B、机器和传感器数据
C、社交数据
D、电子商务数据
正确答案
第13题以下不是数据仓库基本特征的是
A、数据仓库是面向主题的
B、数据仓库是面向事务的
C、数据仓库的数据是相对稳定的
D、数据仓库的数据是反映历史变化的
正确答案
第14题数据清洗的方法不包括
A、缺失值处理
B、噪声数据清除
C、一致性检查
D、重复数据记录处理
正确答案
是MicrosoftOffice的核心组件
A、SQL
B、WORD
C、PPT
D、EXCEL
正确答案
第16题医疗大数据的来源主要包括
A、制药企业/生命科学
B、临床医疗/实验室数据
C、费用报销/利用率
D、健康管理/社交网络
正确答案
第17题层次方法可以分为
A、K均值算法
B、K中心点算法
C、凝聚法
D、分裂法
正确答案
第18题数据归约DataReduction主要有
A、维度规约
B、样本规约
C、数据聚集
D、离散化概念分层
正确答案
第19题KNIMEKonstanzInformationMiner是一个对用户友好的、智能、开源的平台该平台包括了、、、
A、数据集成
B、数据处理
C、数据分析
D、数据挖掘
正确答案BCD
以下可以用于数据可视化的是
A、R语言
B、Excel
C、RapidMiner
D、Weka
正确答案BCD
第21题网络数据采集常用的是通过或等方式从网站上获取数据信息
A、网络爬虫
B、网站公开API
C、手动获取
正确答案
第22题大数据时代预测人类移动行为的数据来源有
A、志愿者定位数据
B、装有导航设备的出租车轨迹数据
C、手机终端定位于通讯记录
D、社会网络签到数据
正确答案BCD
第23题医疗领域如何利用大数据
A、临床决策支持
B、个性化医疗
C、社保资金安全
D、用户行为分析
正确答案BCD
第24题按照数据量的大小可将数据分析分为
A、内存级数据分析
B、Bl级数据分析
C、海量级数据分析
D、巨量级数据分析
正确答案
数据分析的类型根据数据分析深度可以分为
A、描述性分析
B、预测性分析s
C、规则性分析
正确答案BC
第26题百度大数据引擎主要包含三大组件
A、开放云
B、数据工厂
C、百度大脑。
正确答案
第27题交通数据分析可用于
A、交通流量实时分析
B、合理进行道路规划
C、信号灯智能调度
D、实时路况查询播报
正确答案BCD
第28题一个HDFS集群由一个和构成此外还有与这两个角色之间作为沟通桥梁的客户端Client
A、一个名字节点
B、若干个名字节点
C、一个数据节点
D、若干个数据节点
正确答案
第29题基于大数据的临床决策支持系统的架构包括
A、支撑层
B、大数据分析层
C、网络层
D、应用层
正确答案BD
云计算的特点是
A、大规模
B、高扩展性
C、虚拟化
D、按需分配
正确答案
第31题分类是根据在数据中发现的描述对象及其关系的信息将数据对象分组
组内相似度高组间差异性大
T、对
F、错
正确答案
第32题移动手机数据相对较低的时空分辨率使其并不适于估测道路上的行车时间但是他们高渗透率和记录期长的特点使其成为分析OD行为的最佳选择
T、对
F、错
正确答案
第33题离群点检测的任务是识别特征显著不同于其他数据的观测值这样的点称为异常点、离群点或孤立点
T、对
F、错
正确答案
第34题时空数据可视化与地理制图学相结合重点对时间与空间维度以及与之相关的信息对象属性建立可视化表征对与时间和空间密切相关的模式及规律进行展示
T、对
F、错
正确答案
第35题弹性是指有容错的机制若一个RDD分片去失Spark可以根据粗粒度的日志数据更新记录的信息重构它
T、对
F、错
正确答案
第36题大数据的基本属性是数据量大
T、对
F、错
正确答案
第37题广播变量在广播后可以修改
T、对
F、错
正确答案F
第38题NoSQL是泛指非关系型、分布式和不提供ACID的数据库它不是单纯地反对关系型数据库而是强调键值存储和文档数据库的优点
T、对
F、错
第39题数据清洗主要是删除原始数据集中的无关数据、重复数据平滑噪声数据筛选掉与挖掘主题无关的数据处理缺失值、异常值
T、对
F、错
正确答案
第40题轨迹数据包含空间和时间属性并且通常规模巨大且维度高
T、对
F、错
正确答案
第41题经典的基于节点和边的可视化是图可视化的主要形式
T、对
F、错
正确答案
第42题直接拿Python输出的图片用于印刷效果很好
T、对
F、错
正确答案F
第43题FPgrowth算法需要对数据库进行3次扫描
T、对
F、错
正确答案
第44题一个属性如果能由另一个或一组属性导出则这个属性可能是冗余的
T、对
F、错
正确答案
第45题每个变量的最大值和最小值之差称为极差
T、对
F、错
第46题多租户技术是为了实现不同使用者之间的资源分配、隔离和共享
T、对
F、错
正确答案
第47题噪声noise是被测量变量的随机误差或方差
T、对
F、错
正确答案
第48题所有关系型数据中的数据全部为结构化数据半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据
T、对
F、错
第49题数据集成DataIntegration是将多个数据源中的数据合并存放到一个一致的数据存储中
T、对
F、错
正确答案
社交数据分析工具是基于社交网站的海量数据而衍生出来的服务型产品但是同时它们反过来也为社交网站提供了巨大的参考价值
T、对
F、错
正确答案
本内容由易百教育整理并发布
页:
[1]