主成分分析步骤
发布时间:2014-12-07 11:35:34
发布时间:2014-12-07 11:35:34
实验步骤:
1. 将原数据进行标准化处理,此处以标准差标准化为例,用spss的步骤:
工具栏中的分析—描述统计—描述—添加所有变量,并将“将标准化得分另存为变量”勾住—得到标准差和均值如下
表一:
工具栏中的转换—计算变量—输入数字表达式:(变量—均值)/标准差—依次导入变量,且输入对应的目标变量得到标准化后的数字
2. 计算相关系数矩阵
工具栏分析—降维—因子分析—导入所有变量—在描述中将系数勾上得到相关系数矩阵
表二:
3.计算特征值及对应的特征向量
工具栏分析—降维—因子分析—导入变量—在描述中勾“原始分析结果”“系数”—在抽取中,方法:主成分;分析:相关性矩阵;输出:未旋转的因子解;抽取:因子的固定数量:4—在得分中勾上“显示因子得分系数矩阵”
表三:
3. 计算主成分的方差贡献率和累计方差贡献率(上一步骤中已经包括了)
表四:
5.计算主成分
表五:
表六:
综上所述,我们可以看出:
1. 第一主成分Z1与t5,t7,t4,t8呈现出较强的正相关.即猪牛羊肉,家禽,水产品,食糠。
第二主成分Z2与t1呈现出较强的负相关,与t6,t9呈现出较强的正相关.即粮食,蛋类及其制品,酒
第三主成分Z3与t2,t3呈现出较强的正相关.即蔬菜,食油
第四主成分Z4与t4,t2呈现出较强的负相关,与t3呈现出较强的正相关.即蔬菜,食油,猪羊肉
2. 表七代表的是各个国家的各个主成分所代表的产品的消费量,即主成分
如:第一行代表的城市是北京,它的第二主成分较大,即Z2,表示北京对粮食,蛋类及其制品,酒的消耗量比较大;第二行代表的城市是天津,它的第二主成分较大,第四主成分次之,表示天津同样对粮食,蛋类及其制品,酒的消耗量也比较大,但是没有北京的需求大,且它对蔬菜,食油,猪羊肉的消耗也比较大;
以此类推,得到各城市对这些产品的消费量,从而生产适量产品,防止劳动产品的剩余或不足。