第十二章 高维数据:在我们的生产生活中,无论是城市交通、医疗健康还是体育分析,都在不断地产生着海量的高维数据。但人类对于数字,尤其是海量高维数据的感知能力不强,这就提出了高维数据可视化的需求。那么究竟什么是高维数据?如何降低数据的维度?如何使用可视化表现出高维数据的特征?本章将着重介绍高维数据可视化的相关知识和技术。12.1数据及其维度:在我们的日常生活中,往往需要描述很多事物,通常一个事物会有很多的属性。表现在数据中,则一个数据点会有很多的属性值,描述这个数据点的各个方面的特征。这些属性,就是数据的维度。本节分为“数据及其维度的介绍”、“高维数据可视化的实例及其可视化意义”、“高维数据可视化的挑战”三个方面,通过全面翔实的例子和介绍引入本章内容。
12.2高维数据变换:高维数据中包含了丰富的信息,而不同属性的重要程度也不一样。如果通过经验来选择重要的属性,丢弃其他属性,往往会导致严重的信息丢失。而从另一个角度来说,高维数据中往往包含冗余的信息,隐藏了重要的信息相关性。而数据降维的方法主要分为线性方法和非线性方法,我们主要介绍两种线性的方法。本节分为“主成分分析法”和“多维尺度分析法”,介绍两种线性降维方法的主要思想及其异同。
12.3高维数据的可视化呈现:有了高维数据的基础知识并掌握了数据降维的主要方法后,我们可以探索更多直接可视化高维数据的技术,这能最大程度地减少信息丢失,并能辅助发现数据的特征。应用合适的可视化方法,能大大地提升我们的分析效率,并提升数据展示的趣味性,使得我们的展示更加有吸引力。本节分为“散点图矩阵”、“平行坐标系”、“基于图标的方法”和“像素图方法”,介绍高维数据可视化的主要技术及其特点。
[单选题]若想保持数据点之间的相对距离不变,以下哪种降维方法是最佳选择?
多维尺度分析
主成分分析
因子分析
奇异值分解
答案:多维尺度分析
[单选题]以下这幅散点图,没有使用哪种视觉通道?
颜色
形状
位置
尺寸[单选题]请选出如图平行坐标系中蓝色线所表示的数据点
(2015,0.5%,0.6%,0.68%,0.63%,Yes,Yes)
(2008,0.2%,0.4%,0.10%,0.63,No,Yes)
(2015,0.5%,0.6%,0.60%,0.10%,Yes,No)
(1945,0.5%,0.1%,0.68%,0.63,Yes,Yes)[单选题]若有一个数据集,每个数据点有5个属性,以下哪种可视化技术最适用于表示其属性两两之间的相关性呢 (  )
散点图矩阵
像素图
降维投影后使用二维散点图进行可视化
平行坐标系[多选题]请选出相关性较强的属性 (  )
Sepal Length 和 Petal Width
Sepal Width 和 Petal Width
Sepal Length 和 Sepal Width
Sepal Length 和 Petal Length
Petal Length 和 Petal Width[多选题]平行坐标系有哪些特点? (  )
布局较散点图矩阵更紧凑
能展现相邻属性的相关性
交互灵活
使用线来表示数据点[多选题]主成分分析法主要关注的指标是什么?
投影坐标内的方差 
投影坐标之间的协方差
所有属性的均值
所有属性的方差[判断题]像素图中颜色的使用对可视化结果的影响不大。

[判断题]主成分分析法的作用是选出数据点中最重要、影响最大的属性。

[判断题]像素柱状图内,一个柱子内部能表示两种属性的变化趋势。

温馨提示支付 ¥1.00 元后可查看付费内容,请先翻页预览!
点赞(0) dxwkbang
返回
顶部