[原创]r语言层次聚类案例附代码数据
发布时间:2017-09-08 19:42:20
发布时间:2017-09-08 19:42:20
#######################################################################
############ 聚类分析
#######################################################################
a=cbind(农业总产值 ,林业总产值, 牧业总产值, 渔业总产值, 农村居民家庭拥有生产性固定资产原值, 农村居民家庭经营耕地面积)# ⭞↚Ѡ䠅㚐㊱
rownames(a)=mydata$地区
detach(mydata)
hc1=hclust(dist(scale(a)),"ward.D2")
cbind(hc1$merge,hc1$height)#
## [,1] [,2] [,3]
## [1,] -22 -24 0.1562347
## [2,] -2 -29 0.4954046
## [3,] -12 -20 0.6158525
## [4,] -4 1 0.7459837
## [5,] -5 -7 0.8431761
## [6,] -27 4 0.8502919
## [7,] -28 -30 0.9238256
## [8,] 2 7 0.9982795
## [9,] -1 -9 1.0586066
## [10,] -14 3 1.0996796
## [11,] -16 -23 1.1292437
## [12,] -25 10 1.2758523
## [13,] -13 -19 1.4055256
## [14,] -3 11 1.4555952
## [15,] -21 6 1.6495578
## [16,] -10 -17 1.7462669
## [17,] 9 15 1.7988319
## [18,] -18 12 1.8498860
## [19,] -6 -11 1.9536216
## [20,] -8 5 2.1881307
## [21,] -15 16 2.5009589
## [22,] -31 20 2.7312571
## [23,] 13 18 3.0129164
## [24,] 8 17 3.0616119
## [25,] 19 23 3.2580779
## [26,] 14 21 4.3774794
## [27,] -26 22 5.2122229
## [28,] 25 26 6.0403304
## [29,] 24 27 8.3310723
## [30,] 28 29 11.4082257
plot(hc1,hang=-2,ylab="欧氏距离",main="ward ")
cutree(hc1,3)
## 北京 天津 河北 山西 内蒙 辽宁 吉林 黑龙江 上海 江苏
## 1 1 2 1 3 2 3 3 1 2
## 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西
## 2 2 2 2 2 2 2 2 2 2
## 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏
## 1 1 2 1 2 3 1 1 1 1
## 新疆
## 3
library(NbClust)# 加载包
res<-NbClust(a, distance ="euclidean", min.nc=2, max.nc=8,
method ="complete", index ="ch")
res$All.index
## 2 3 4 5 6 7 8
## 22.4859 64.2952 95.0505 91.2070 112.2167 126.6607 125.0580
res$Best.nc
## Number_clusters Value_Index
## 7.0000 126.6607
res$Best.partition
## 北京 天津 河北 山西 内蒙 辽宁 吉林 黑龙江 上海 江苏
## 1 2 2 3 4 5 5 4 6 1
## 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西
## 5 1 1 3 2 1 3 3 3 1
## 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏
## 1 1 1 1 2 7 1 2 5 5
## 新疆
## 4
#######################################################################
############ 因子分析
#######################################################################
x=a
scale(x,center=T,scale=T)
## 农业总产值 林业总产值 牧业总产值 渔业总产值
## 北京 -1.22777296 -0.68966546 -1.0576108 -0.717868590
## 天津 -1.20072019 -1.32628581 -1.1287831 -0.587405030
## 河北 1.44015787 -0.40768816 1.2735925 -0.276307864
## 山西 -0.60736290 -0.39313054 -0.8459665 -0.730089499
## 内蒙 -0.31173176 -0.16449038 0.3536925 -0.682760278
## 辽宁 0.02317599 0.21376291 1.0886323 0.905582647
## 吉林 -0.31664133 -0.16033106 0.3705164 -0.661159286
## 黑龙江 0.73000004 0.28496065 0.6928325 -0.543827843
## 上海 -1.22304555 -1.24358878 -1.1769433 -0.598687930
## 江苏 1.32304764 -0.14014613 0.5106958 2.558246143
## 浙江 -0.25945707 0.37842297 -0.4799669 1.088655075
## 安徽 0.32193142 1.20245730 0.3549653 0.277626262
## 福建 -0.22816878 1.77681021 -0.5790521 1.668371030
## 江西 -0.46544975 1.43990544 -0.1820088 0.139953438
## 山东 2.22835882 -0.05133246 2.0610374 2.643122498
## 河南 2.22683767 0.36264203 2.0166955 -0.521101240
## 湖北 0.88705181 -0.13647615 0.6684891 0.925656025
## 湖南 1.03609706 1.81987138 0.8945726 -0.002409428
## 广东 0.65132842 1.36442604 0.3760463 1.697020485
## 广西 0.19109441 1.64358969 0.2862654 0.136415807
## 海南 -0.95958625 0.32594217 -0.9698633 -0.119446069
## 重庆 -0.61246376 -0.82851329 -0.6191076 -0.632081027
## 四川 1.13921636 0.49292656 2.0375425 -0.313747797
## 贵州 -0.59146827 -0.69749477 -0.6664339 -0.677051827
## 云南 -0.10569354 1.40222691 0.0524867 -0.583545796
## 西藏 -1.33060989 -1.32909946 -1.1967954 -0.752065694
## 陕西 0.01099770 -0.64550329 -0.4072439 -0.713500151
## 甘肃 -0.48272891 -1.11489458 -0.9441448 -0.747831257
## 青海 -1.27264229 -1.30451055 -1.0825979 -0.751154486
## 宁夏 -1.16021392 -1.24089745 -1.1284759 -0.716850181
## 新疆 0.14646191 -0.83389594 -0.5730687 -0.711758136
## 农村居民家庭拥有生产性固定资产原值 农村居民家庭经营耕地面积
## 北京 -0.521919855 -0.69519658
## 天津 -0.036498322 -0.33578982
## 河北 0.004069841 -0.23262677
## 山西 -0.824825602 -0.02962851
## 内蒙 1.179852466 2.59936535
## 辽宁 0.730243656 0.39633505
## 吉林 0.724094855 1.89053536
## 黑龙江 1.396721068 3.65096289
## 上海 -1.404513394 -0.77506475
## 江苏 -0.340308064 -0.44560856
## 浙江 0.499884752 -0.68188522
## 安徽 -0.279565363 -0.23262677
## 福建 -0.618739413 -0.61865625
## 江西 -0.805278639 -0.33911766
## 山东 0.133404538 -0.31582278
## 河南 -0.500048919 -0.32247846
## 湖北 -0.721961668 -0.29252790
## 湖南 -0.917381131 -0.45559208
## 广东 -0.957062704 -0.68521306
## 广西 -0.615649655 -0.40567447
## 海南 -0.663204069 -0.58537785
## 重庆 -0.570175555 -0.43229719
## 四川 -0.420353046 -0.48221480
## 贵州 -0.604823220 -0.46890344
## 云南 0.118332502 -0.32913414
## 西藏 3.590383141 -0.23262677
## 陕西 -0.572497480 -0.35575687
## 甘肃 0.165991341 0.04358397
## 青海 0.415065901 -0.25259382
## 宁夏 0.655330865 0.36638449
## 新疆 1.761431173 1.05524743
## attr(,"scaled:center")
## 农业总产值 林业总产值
## 1514.206129 111.206129
## 牧业总产值 渔业总产值
## 877.092581 280.839032
## 农村居民家庭拥有生产性固定资产原值 农村居民家庭经营耕地面积
## 17865.076774 2.589032
## attr(,"scaled:scale")
## 农业总产值 林业总产值
## 1097.854553 81.744167
## 牧业总产值 渔业总产值
## 683.552567 373.131010
## 农村居民家庭拥有生产性固定资产原值 农村居民家庭经营耕地面积
## 9767.757883 3.004952
cor(x)#
## 农业总产值 林业总产值 牧业总产值
## 农业总产值 1.00000000 0.4304367 0.9148545
## 林业总产值 0.43043666 1.0000000 0.4593615
## 牧业总产值 0.91485445 0.4593615 1.0000000
## 渔业总产值 0.51598365 0.4351225 0.4103977
## 农村居民家庭拥有生产性固定资产原值 -0.16652881 -0.3495913 -0.1017802
## 农村居民家庭经营耕地面积 0.04040478 -0.0961515 0.1426829
## 渔业总产值
## 农业总产值 0.5159836
## 林业总产值 0.4351225
## 牧业总产值 0.4103977
## 渔业总产值 1.0000000
## 农村居民家庭拥有生产性固定资产原值 -0.2131248
## 农村居民家庭经营耕地面积 -0.2669966
## 农村居民家庭拥有生产性固定资产原值
## 农业总产值 -0.1665288
## 林业总产值 -0.3495913
## 牧业总产值 -0.1017802
## 渔业总产值 -0.2131248
## 农村居民家庭拥有生产性固定资产原值 1.0000000
## 农村居民家庭经营耕地面积 0.5316341
## 农村居民家庭经营耕地面积
## 农业总产值 0.04040478
## 林业总产值 -0.09615150
## 牧业总产值 0.14268286
## 渔业总产值 -0.26699659
## 农村居民家庭拥有生产性固定资产原值 0.53163410
## 农村居民家庭经营耕地面积 1.00000000