南开21春学期《大数据导论》在线作业(随机题目)
21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据导论》在线作业试卷总分100得分100
南开在线作业答案 QQ 515224986
第1题数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段()。
A、运营式系统阶段
B、用户原创内容阶段
C、感知式系统阶段
正确答案
第2题第一个提出大数据概念的公司是()。
A、麦肯锡公司
B、谷歌公司
C、微软公司
D、脸谱公司
正确答案
第3题以下不是数据仓库基本特征的是()
A、数据仓库是面向主题的
B、数据仓库是面向事务的
C、数据仓库的数据是相对稳定的
D、数据仓库的数据是反映历史变化的
正确答案
第4题基础设施即服务的英文简称是
A、IaaS
B、PaaS
C、SaaS
正确答案
大数据的特点不包含
A、数据体量大
B、价值密度高
C、处理速度快
D、数据不统一
正确答案
第6题SAN是一种()
A、存储设备
B、专为数据存储而设计构建的网络
C、光纤交换机
D、HBA 易百教育www.openhelp100.com
正确答案
第7题数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。
A、运营式系统阶段
B、用户原创内容阶段
C、感知式系统阶段
正确答案
第8题医疗健康数据的基本情况不包括以下哪项?
A、诊疗数据
B、个人健康管理数据
C、公共安全数据
D、健康档案数据
正确答案
第9题()是MicrosoftOffice的核心组件
A、SQL
B、WORD
C、PPT
D、EXCEL
正确答案
哪个选项不属于大数据4V特点?
A、Volume
B、Valid
C、Variety
D、Value
正确答案
第11题以下哪项不是数据可视化工具的特性()
A、实时性
B、简单操作
C、更丰富的展现
D、仅需一种数据支持方式即可
正确答案
大数据的最显著特征是()。
A、数据规模大
B、数据类型多样
C、数据处理速度快
D、数据价值密度高
正确答案
第13题MapReduce中的Map和Reduce函数使用()进行输入输出
A、key/value对
B、随机数值
C、其他计算结果
正确答案
第14题数据仓库是随着时间变化的下列不正确的是()
A、数据仓库随时间变化不断增加新内容
B、捕捉到的新数据会覆盖原来的快照
C、数据仓库随事件变化不断删去旧的数据内容
D、数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
正确答案
GFS中的文件切分成()的块进行存储
A、32MB
B、64MB
C、128MB
D、1G
正确答案
第16题开放云()
A、价值呈现:大数据应用价值呈现和创新不足
B、应用建设:周期长、门槛高、多冗余、体验差
C、组织流程:应用跨部门,缺乏流程贯串和使能业务生产
D、生态建设:无法有效构建和融入新的数字生态圈
正确答案BCD
第17题##和##它们把原数据变换或投影到较小的空间。
A、小波变换
B、中心化变换
C、主成分分析
D、对数变换
正确答案C
第18题下列属于传统统计学展示方法的是()
A、柱状图
B、饼状图
C、曲线图
D、网络图
正确答案BC
第19题数据工厂包括
A、低能耗数据中心
B、超大规模讲分布式架构
C、新一代智能自动化运维
D、超强云安全
正确答案BCD
数据变换的常用方法有########
A、中心化变换
B、极差规格化变换
C、标准化变换
D、对数变换
正确答案BCD
第21题大数据在医疗中的应用有()
A、流行性疾病预防
B、慢性病健康管理
C、临床决策支持
D、医疗器械研发
正确答案BCD
第22题可视化工具包括()
A、Excel
B、GoogleChart
C、Gephi
D、ppt
正确答案BC
第23题大数据时代预测人类移动行为的数据来源有
A、志愿者定位数据
B、装有导航设备的出租车轨迹数据
C、手机终端定位于通讯记录
D、社会网络签到数据
正确答案BCD
第24题大数据带来的挑战有哪些()。
A、会导致数据盲点
B、危及个人隐私
C、造成群体歧视
D、产生庞大能耗
正确答案
传感器工作模式类别包括()
A、基于位置
B、基于活动
C、基于设备
正确答案BC
第26题去除噪声使得数据光滑的技术主要有
A、分箱
B、回归
C、离群点分析
正确答案BC
第27题可使用######进行光滑。
A、最大值
B、箱中位数
C、箱边界
D、箱均值
正确答案CD
第28题最常用的方式是企业自己搜集自己生产系统所产生的数据除生产系统的数据外企业的信息系统还充斥着大量的()等。
A、用户行为数据
B、日志式的活动数据
C、事件信息
正确答案BC
第29题大数据存储的特点与挑战有()
A、容量问题
B、延迟问题
C、安全问题
D、成本问题
正确答案BCD
统计图表的可视化方法主要包括()
A、散点图
B、折线图
C、条形图
D、饼图
正确答案
第31题Spark的亮点是充分利用内存承载工作集而且能保证容错。
T、对
F、错
第32题知识图谱的构建属于大数据在社交网络中的应用
T、对
F、错
正确答案
第33题道路速度视图显示每条道路的速度模式
T、对
F、错
正确答案
第34题越来越多的企业通过架设海量数据采集系统多用于系统日志采集这些工具均采用分布式架构能满足每秒数百兆的日志数据采集和传输需求。
T、对
F、错
正确答案
第35题Apriori算法扫描数据库的次数等于最大频繁项集的项数。
T、对
F、错
第36题数据仓库中的元数据分为技术元数据和业务元数据
T、对
F、错
正确答案
第37题大数据数据量一定是PBTB级的
T、对
F、错
正确答案F
第38题21世纪时数据信息大发展的时代移动互联、社交网络、电子商务等极大拓宽了互联网的边界和应用范围各种数据正在迅速膨胀并变大。
T、对
F、错
第39题数据获取方式分为主动式获取和被动式获取
T、对
F、错
第40题数据存取和共享机制是大数据发展面临的挑战
T、对
F、错
第41题发现满足最小支持度阈值的所有项集这些项集被称为频繁项集。
T、对
F、错
第42题利用大数据技术对电子病历中的数字化信息进行分析处理既能够让医生的诊疗有迹可循还可以发现最有效的临床路径从而及时为医生提供最佳的诊疗建议。
T、对
F、错
第43题数据清洗主要是删除原始数据集中的无关数据、重复数据平滑噪声数据筛选掉与挖掘主题无关的数据处理缺失值、异常值。
T、对
F、错
第44题分类是在给定数据基础上构建分类函数或分类模型将数据划分到预定义的目标类中的某一种类别。
T、对
F、错
第45题大数据的挑战仅仅来自于数据的增长。
T、对
F、错
正确答案F
第46题Excel采用插件的形式来实现数据挖掘功能其数据挖掘插件主要包括Excel表分析工具和Excel数据挖掘客户端
T、对
F、错
正确答案
第47题不同类型的大数据可以揭示一个区域或城市的活动以及人口分布状态()
T、对
F、错
第48题Paas软件即服务。它是一种通过Internet提供软件的模式用户无需购买软件而是向提供商租用基于Web的软件来管理企业经营活动。
T、对
F、错
正确答案F
第49题IDC给出的大数据定义是大数据(BigData)是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
T、对
F、错
正确答案F
非结构化数据是指非纯文本类数据没有标准格式无法直接解析出相应的值
T、对
F、错
本内容由易百教育整理发布
www.openhelp100.com
页:
[1]