统计学

 翻译样例中心 >> 社会科学翻译样例 >> 统计学

翻译样例: 降维:主成分分析
版权信息   版权信息

注意到前五个成分占所有13个初始变量的整个方差的80%多。这表明我们能用少于最初维数一半的维数得到包含在数据中大部分的变化。和原始数据相比主成分分析的进一步的好处是这些变量是不相关的(相关系数=0)。如果我们用主成分作为独立的变量建立回归模型时,我们不会遇到多重共线性的问题。  在输出1中所示的主成分是用含有单位方差的变量标准化的版本替换每个最初的变量计算。这通过每个变量都除以标准差可以很容易得到。标准化的效果是按照变动性给每个变量相同的重视。对于什么时候进行标准化的问题必须在使用数据的自然属性的信息时回答。当衡量的单元对变量来说是常见的,比如美元,这时不对数据的单位变化进行重新标定,会比较理想。如果变量用很不同的单元度量,以至于不知道如何比较不同变量的变动性。建议用标称单位变动,这样在衡量单元的变化不会引起主成分权重的变化。在很少的情形下,我们能给出变量相对的权重,在做主成分分析之前,我们将用标准化的变量乘以这些权重。  由于变量的异质的属性,重新标定在关于酒的数据的变量是很重要的。如表3中所示,前五个主成分在没有标定的原始的数据基础上算出的。注意到变量proline是第一个主成分,它几乎解释了在数据中所有的方差。这是因为它的标准差是351和其次的大的变量magenesium的标准差15相比的缘故。所有其他的标准差大约是proline的标准差的1%(或不到)。

收稿邮箱: sotrans@126.com
QQ: 1169561052    MSN: jesczhao@hotmail. com

最新翻译样例

相关翻译样例

专业英语词汇频道