题目
[不定项选择题]大数据的“4V”特性有(    )。
  • A.数据量大
  • B.数据多样性
  • C.价值密度低
  • D.数据的产生和处理速度快
  • E.数据易被取得
答案解析
答案: A,B,C,D
答案解析:

本题考查大数据。

大数据的“4V”特性有数据量大、数据多样性、价值密度低、数据的产生和处理速度快。

因此,本题正确答案为ABCD。

查看答案
本题来源:第二十三章 第5节 数据科学与大数据
去题库练习
拓展练习
第1题
[单选题]下列选项中不属于大数据“4V”特性的是(    )。
  • A.数据量大
  • B.数据多样性
  • C.价值密度高
  • D.数据的产生和处理速度快
答案解析
答案: C
答案解析:

本题考查大数据。

大数据具有数据量大、数据多样性、价值密度低、数据的产生和处理速度快的“4V”特性。

因此,本题正确答案为选项C。

点此查看答案
第2题
[单选题]从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中但又有潜在价值的信息和知识的过程是(    )。
  • A.数据分析
  • B.数据挖掘
  • C.数据可视化
  • D.数据研究
答案解析
答案: B
答案解析:

本题考查数据挖掘。

【B选项正确】数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中但又有潜在价值的信息和知识的过程。

因此,本题正确答案为选项B。

点此查看答案
第3题
[不定项选择题]数据挖掘的定义包含以下几层含义(    ) 。
  • A.数据源必须是真实的、大量的、有噪声的
  • B.发现的是用户感兴趣的知识
  • C.所有发现的知识都是绝对的
  • D.发现的知识是可接受、可理解、可运用的
  • E.并不要求发现放之四海而皆准的知识,仅支持特定的发现问题
答案解析
答案: A,B,D,E
答案解析:

本题考查数据挖掘。

数据挖掘(data mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中但又有潜在价值的信息和知识的过程。该定义包含以下几层含义:

①数据源必须是真实的、大量的、有噪声的;【A选项正确】

②发现的是用户感兴趣的知识;【B选项正确】

③发现的知识是可接受、可理解、可运用的;【D选项正确】

④并不要求发现放之四海而皆准的知识,仅支持特定的发现问题。【E选项正确】

因此,本题正确答案为选项ABDE。

点此查看答案
第4题
[单选题]监督学习有两大类典型任务:分类和回归。下列各项中,属于回归的是(    )。
  • A.根据发件人、主题等信息判断是否为垃圾邮件
  • B.根据房屋面积、位置等信息预测房价
  • C.根据用户满意度、评价信息判断用户到期后是否会续约
  • D.

    根据客户的能力、品格、担保、资本等特征评价客户的信用等级

答案解析
答案: B
答案解析:

本题考查数据挖掘。

回归是通过特征变量确定观测单位因变量的取值,因变量是定量变量。

例如,根据钻石的克拉数、颜色、切割工艺等信息预测钻石的价格,根据房屋面积、位置、楼层等信息预测房价【选项B正确】

根据发件人、主题等信息判断是否为垃圾邮件属于监督学习中的分类【选项A错误】

根据用户满意度、评价信息判断用户到期后是否会续约也属于监督学习中的分类【选项C错误】

根据客户的能力、品格、担保、资本等特征评价客户的信用等级属于无监督学习中的降维【选项D错误】

因此,本题正确答案为选项B。

点此查看答案
第5题
[不定项选择题]常用的无监督学习方法有(    )。
  • A.

    聚类分析

  • B.

    回归分析

  • C.降维分析
  • D.分类分析
  • E.半监督分类分析
答案解析
答案: A,C
答案解析:

本题考查数据挖掘。

无监督学习有两大类典型任务:聚类和降维【选项AC正确】

监督学习有两大类典型任务:分类和回归【选项BD错误】

半监督分类属于半监督学习【选项E错误】

因此,本题正确答案为选项AC。

点此查看答案
  • 领取礼包
  • 咨询老师
  • 在线客服
  • 购物车
  • App
  • 公众号
  • 投诉建议