多变量统计方法用于分析多个随机变量的联合行为。从下面的不同统计方法示例中可以看出,可以使用多种多变量技术。这些技术可以使用 Statgraphics Centurion 19 的多元统计分析来完成。

矩阵图

矩阵图用于显示一组定量变量的所有 X-Y 图对。它们是检测强相关性变量对的好方法。还可以检测看似异常值的案例。右边的矩阵图有两个补充:1.对角线位置中每个变量的箱须图。2. 每个图的鲁棒 LOWESS 平滑,突出显示变量之间的估计关系。

矩阵图.png

更多:矩阵图.pdf 

相关分析

多变量分析(相关性)过程旨在汇总两列或多列数值数据。它计算每个变量的汇总统计数据,以及变量之间的相关性和协方差。这些图形包括散点图矩阵、星形图和太阳射线图。此过程通常在构建多元回归模型之前使用。

corrmat.png

更多: 多变量分析.pdf 

蜘蛛/雷达图

雷达图或蜘蛛图用于根据具体情况显示多个定量变量的值。左图比较了 3 个不同品牌的特征。

蜘蛛.png

更多:雷达蜘蛛图.pdf 

主成分和因子分析

主成分或因子分析推导出多个定量变量的线性组合,这些变量解释了这些变量之间最大百分比的变异。这些类型的分析用于降低问题的维度,以便更好地理解影响这些变量的潜在因素。在许多情况下,少量的成分可以解释总体变异性的很大比例。对这些因素的正确解释可以为起作用的机制提供重要的见解。

pca.png

更多:主成分.pdf, 因子分析.pdf 

聚类分析

聚类分析根据观测值或变量之间的相似性对观测值或变量进行分组。左侧的树状图显示了分层聚类过程的结果,该过程从单独的观测值开始,并根据它们在多变量空间中的距离将它们分组在一起。

集群.png

更多:聚类分析.pdf 

判别分析

判别分析过程旨在根据一组观察到的 p 个定量变量帮助区分两组或多组数据。它通过构造判别函数来实现这一点,这些判别函数是变量的线性组合。这种分析的目标通常是以下一项或两项:

1. 能够以数学方式描述观察到的案例,尽可能将它们分成几组。2. 能够将新观测值分类为属于一个或另一个组。

聚类分析图像 .png

更多:判别分析.pdf 

神经网络贝叶斯分类器

神经网络分类器实现了一种非参数方法,用于根据 p 个观察到的定量变量将观测值分类为 g 组之一。它不是对每个组内变量分布的性质做出任何假设,而是根据该组的相邻观测值在所需位置构建每个组的密度函数的非参数估计。该估计值是使用 Parzen 窗口构建的,该窗口根据每个组与指定位置的距离对每个组的观测值进行加权。

神经-1.png

更多:神经网络分类器.pdf 

偏最小二乘法

偏最小二乘法旨在构建一个统计模型,将多个自变量 X 与多个因变量 Y 相关联。当存在许多预测变量且分析的主要目标是预测响应变量时,该过程最有用。与其他回归过程不同,即使在预测变量数量超过观测值的情况下,也可以得出估计值。PLS被化学工程师和化学计量学家广泛用于光谱校准。

请.png

更多:偏最小二乘法.pdf 

典型相关性

典型相关性过程旨在帮助识别两组变量之间的关联。它通过在两个集合中寻找表现出强相关性的变量的线性组合来实现这一点。相关性最强的线性组合对形成第一组典型变量。第二组典型变量是线性组合对,在与第一组不相关的所有组合中,线性组合的相关性次之强。通常,可以使用少量的对来量化两个集合之间存在的关系。

规范.png

更多:典型相关性.pdf 

多变量正态性检验

此过程测试一组随机变量是否合理地来自多元正态分布。它包括 Royston 的 H 检验和基于每个观测值与样本质心的平方距离的卡方图的检验。

mvnormal.png

更多:多变量正态性检验.pdf观看视频 

多变量公差限值

“多变量容差限”过程为由多个变量组成的数据创建统计容差限。它包括一个容差区域,该容差区域以 100(1-alpha)% 的置信度将选定的总体 p% 界定为边界。它还包括使用 Bonferroni 方法对每个变量的联合同时公差限值。假定数据是来自多元正态分布的随机样本。通常将多变量公差限值与多个变量的规格进行比较,以确定大多数总体是否在规格范围内。

mvtolerance-4.png

更多: 多变量公差限值.pdf 

多维扩展

多维缩放过程旨在在低维空间中显示变量数据。给定每对 n 个多变量观测值之间的 n x n 距离矩阵,该过程将搜索这些观测值的低维表示,以尽可能保留它们之间的距离。主要输出是该低维空间(通常为 2 或 3 维)中点的地图。

mds2-1.png

更多:多维缩放.pdf观看视频

沪ICP备05040608号-14