Q型聚类分析报告_第1页
Q型聚类分析报告_第2页
Q型聚类分析报告_第3页
Q型聚类分析报告_第4页
Q型聚类分析报告_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分析报告为了研究上海各区、县工业企业在2009年的发展情况,我们选取上海统计局的官方数据,一共有单位数、从业人员、工业总产值、年末资产总计、主营业务收入和利润总额六个指标变量,样本为19个,包括上海18个区县和其他,对这些数据分别进行系统聚类分析和K-均值聚类分析。原始数据如下表所示:上海市各区、县工业企业主要指标(2009)地区单位数(个)从业人员(万人)工业总产值(亿元)年末资产总计(亿元)主营业务收入(亿元)利润总额(亿元)浦东新区385866.766982.937880.647702.68476.19黄浦区451.4494.09153.70146.914.77卢湾区320.8361.6777.3270.304.42徐汇区3565.79500.58469.59550.7535.41长宁区1031.3576.95119.6783.157.44静安区320.3517.8254.8220.833.59普陀区3514.89223.24275.81246.8223.64闸北区1672.86134.74213.26138.393.71虹口区991.4256.5778.7461.974.77杨浦区2534.33647.671043.94666.02122.54闵行区229339.753322.872793.743406.04172.29宝山区110415.901907.132627.892148.21111.94嘉定区249836.812473.612018.472579.09174.97金山区100415.011039.00849.211036.5049.04松江区191340.433171.102110.733157.8689.40青浦区158123.601045.781049.841024.1654.58奉贤区188520.241093.941016.291051.1360.33崇明县2936.71273.94408.53275.1910.41其他391.43967.611353.081055.0722.54本表为主营业务收入在500万元以上企业。原南汇区划并入浦东新区。

、系统聚类分析过程如下:1、接近度矩阵ProximityMatrixCase1:浦东新区2:黄浦区3:卢湾区4:徐汇区5:长宁区6:静安区7:普陀区8:闸北区1:浦东新区.00091.95893.13481.33891.94393.90485.87990.3262:黄浦区91.958.000.005.340.005.013.153.0203:卢湾区93.134.005.000.410.006.002.190.0364:徐汇区81.338.340.410.000.331.462.076.2475:长宁区91.943.005.006.331.000.012.130.0166:静安区93.904.013.002.462.012.000.219.0497:普陀区85.879.153.190.076.130.219.000.0798:闸北区90.326.020.036.247.016.049.079.0009:虹口区92.518.007.005.364.001.008.146.01910:杨浦区73.4061.5801.681.7291.5601.7561.0741.51011:闵行区28.95219.22819.75914.51319.17620.11816.32218.34312:宝山区49.9236.5136.8384.0056.5237.0435.0706.09113:嘉定区35.88415.49515.93011.30215.36516.22212.71414.64014:金山区68.2122.1142.281.8142.0732.3951.1971.79115:松江区37.72714.72915.20410.82314.72515.53312.32713.92816:青浦区62.2164.3264.5452.4494.2364.6862.9153.81017:奉贤区61.4954.8445.0592.8564.7225.1933.3274.29618:崇明县85.589.169.219.095.162.255.033.08319:其他78.147.9451.064.5301.0111.142.833.907Thisisadissimilaritymatrix(表格太大,不能完全显示)上述输出结果表示接近度矩阵,是反映样品之间相异性的矩阵,本例中由于计算距离使用的是平方欧氏距离,所以样品间距离越大,说明各县区工业企业发展情况越相异。由表中矩阵可以看出,长宁区和虹口区的距离最小,即说明这两个区的工业企业发展情况最接近。

2、冰柱图上图为冰柱图,同样能够反映聚类情况,如果设定类数为四类,那么由上图可知,闵行区左侧的为第一类,包括松江区、嘉定区和闵行区;宝山区左侧为第二类,包括丰贤区、青浦区、金山区和宝山区;黄浦区左侧的为第三类,包括杨浦区、其他、崇明县、普陀区、徐汇区、闸北区、静安区、卢湾区、虹口区、长宁区和黄浦区;而浦东新区为第四类。

3、聚类过程的结果AgglomerationScheduleStageClusterCombinedCoefficientsStageClusterFirstAppearsNextStageCluster1Cluster2Cluster1Cluster2159.001003236.002004325.004014423.006325528.0144096718.033007747.06806981617.1130011924.126571010219.2849012111416.451081512210.48210016131113.6750014141115.889130171512141.21901116162121.893121517172114.898161418181212.0000170上图反映每一阶段聚类的结果,coefficients表示聚合系数,第2列和第3列表示聚合的类,此图中第一阶段时(stage=1)第5个样品---长宁区和第9个样品----虹口区聚为一类。4、聚合系数随分类数的变化曲线图由上图的聚合系数利用Excel作出聚合系数随分类数变化曲线,如下图所示,由下图可以看出,当分类数为3或4时,曲线变得比较平缓,这个分类数符合我们分类的目的。聚合系数随分类数的变化曲线分类数系列15树状聚类图Dendrogram火火火火火HiERARCHICALCLUSTERANALYSIS火火火DendrogramusingAverageLinkage(WithinGroup)RescaledDistanceClusterCombineCASE 0 5 10 15 20 25Label Num+ -+ + +- + +长宁区5-+虹口区9-+黄浦区2-+卢湾区3-+静安区6-+闸北区8-+普陀区7-+崇明县18-+-+徐汇区4-++---+其他19-+| |杨浦区10---+ + +青浦区16-+ ||奉贤区17-+---+||金山区14-+ +-++ +宝山区12 +||闵行区11---+||嘉定区13---+ +|松江区15---+|浦东新区1 — +上图是树状聚类图,从图中可以由分类个数得到分类情况。如果我们选择分类数为3,就从距离为5的地方切下去,得到分类结果如下:{1。长宁区、虹口区、黄浦区、卢湾区、静安区、闸北区、普陀区、崇明县、徐汇区、其他、杨浦区、青浦区、丰贤区};{2。松江区、嘉定区、闵行区、宝山区、金山区};{3。浦东新区}。很明显,在这三类中,箝类浦东新区,以各类新型服务业发展经济,不以工业企业为主;第2类地区中,属于上海郊区,有各类汽车、金属等重工业制造企业,逐渐成为上海工业企业发展的主要区域;第1类则介于上述两类之间。二、K---均值聚类分析过程如下:1、最初各类的重心InitialClusterCentersCluster123单位数3858229332从业人员66.7639.75.35工业总产值6982.933322.8717.82年末资产总计7880.642793.7454.82主营业务收入7702.683406.0420.83利润总额476.19172.293.592、样品的分类情况ClusterMembershipCaseNumber地区ClusterDistance1浦东新区1.0002黄浦区3714.2303卢湾区3811.6524徐汇区3146.0325长宁区3740.6846静安区3869.1127普陀区3398.7428闸北区3605.5349虹口区3785.53110杨浦区3642.61211闵行区2993.80012宝山区21375.285

13嘉定区214金山区315松江区216青浦区317奉贤区318崇明县319其他3745.2171054.517630.4931503.1131760.292312.2201225.339由上图可知,快速聚类法将样品分为三类:{1。浦东新区};{2。闵行区、宝山区、嘉定区、松江区};{3。长宁区、虹口区、黄浦区、卢湾区、静安区、闸北区、普陀区、崇明县、徐汇区、其他、杨浦区、青浦区、丰贤区、金山区}。此分类结果与系统聚类基本一致。3、最后各类的重心FinalClusterCentersCluster123单位数38581952446从业人员66.7633.226.45工业总产值6982.932718.68445.26年末资产总计7880.642387.71511.70主营业务收入7702.682822.80459.09利润总额476.19137.1529.094、方差分析表IterationHistoryaIterationChangeinClusterCentersMeanSquaredfMeanSquaredfFSig.单位数8015822.8872.000366765.92916.00021.8552.658E-5从业人员2515.1812.00072.23616.00034.8191.485E-6工业总产值2.528E72.000228386.48916.000110.6794.263E-10年末资产总计2.837E72.000194298.77316.000146.0035.302E-11主营业务收入3.007E72.000206123.69516.000145.8895.334E-11利润总额102957.9822.0001272.094

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论