版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、关于某公司474名职工综合状况的统计分析报告一、数据介绍:本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id(职工编号),gender(性别),bdate(出生日期),edcu (受教育水平程度),jobcat (职务 等级),salbegin (起始工资),salary (现工资),jobtime(本单位工作经历 月),prevexp(以 前工作经历 月),minority(民族类型),age(年龄)。通过运用spss统计软件,对变量进 行频数分析、描述性统计、方差分析、相关分析、。以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。二、数据
2、分析1、频数分析。基本的统计分析往往从频数分析开始。通过频数分析能够了解变量的取值状况,对把握数据的分布特征非常有用。此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu (受教育水平程度)、不同的状况下的频数分析,从 而了解该公司职工的男女职工数量、受教育状况的基本分布。StatisticsGenderEducationalLevel (years)NValid474474Missing00首先,对该公司的男女性别分布进行频数分析,结果如下:GenderFrequencyPercentValid PercentCumulativePercentValidFe
3、male21645.645.645.6Male25854.454.4100.0Total474100.0100.0上表说明,在该公司的 474名职工中,有216名女性,258名男性,男女比例分别为 45.6% 和54.4%,该公司职工男女数量差距不大,男性略多于女性。其次对原有数据中的受教育程度进行频数分析,结果如下表:Educational Level (years)FrequencyPercentValid PercentCumulativePercentValid85311.211.211.21219040.140.151.31461.31.352.51511624.524.577.01
4、65912.412.489.517112.32.391.81891.91.993.719275.75.799.4202.4.499.8211.2.2100.0Total474100.0100.0H is to g ra m002ycneJogF0050OMe a n = 13.49S td. De v. = 2.885N = 4741012.51517.52022.5E d u c a tio n a l Le ve l (ye a rs )上表及其直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的40.1%,其次为15年,共有116人,占中人数的
5、24.5%。且接受过高于20 年的教育的人数只有1人,比例很低。2、描述统计分析。再通过简单的频数统计分析了解了职工在性别和受教育水平上的总体分 布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算 基本描述统计的方法来实现。下面就对各个变量进行描述统计分析,得到它们的均值、 标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。Descriptive StstisticsrNMinimumMaximumMea nStd.Deviati onSkew nessKurtosisStatisticStatist icStatist icStatisticStatis
6、ticStatisticStd.Erro rStatisticStd.Erro rEducati on al Level (years)47482113.492.885-.114.112 -.265.224Curre ntSalary474$15,750$135,000$34,419.57$17,075.6612.125.112 f5.378.224Begi nningSalary474$9,000$79,980$17,016.09$7,870.6382.853.112 12.390 .2:24PreviousExperie nc e(mon ths)474047695.86104.5861.
7、510.112 1.696.2241Mon ths sinceHire474639881.1110.061-.053.112 -1.153 .22!4如表所示,以起始工资为例读取分析结果,474名职工的起始工资最小值为$9000 ,最大值为$ 79980,平均起始工资为$ 17016,标准差为$ 7870.638 ,偏度系数和峰度系数分别为 2.853和12.390。其他数据依此读取,则该表表明474名职工的受教育水平、起始工资、现工资、先前工作经验、现在工作经验的详细分布状况。3、Exploratory data analysis 。(1)交叉分析。通过频数分析能够掌握单个变量的数据分布情况
8、,但是在实际分析中,不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。就本数据而言,需要了解现工资与性别、年龄、受教育水平、 起始工资、本单位工作经历、以前工作经历、职务等级的交叉分析。现以现工资与职务等级的列联表分析为例,读取数据(下面数据分析表为截取的一部分):Current Salary * Employment Category CrosstabulationCountEmployment CategoryTotalClericalCustodialManagerCurrent$15,7501001Salary
9、$15,9001001$16,2003003$16,3501001$16,5001001$16,6501001$16,8001001$16,9503003$17,1002002$17,2501001$17,4002002$17,7001001$18,1502002$18,4501001$18,7501001$19,2002002$19,6506006$19,8001001$19,9502002Bar C h a rtiiE m p lo ym5,7 ,0,1 ,3,4,6,7 ,9,0,2,3,6,8,45,0,4,8,6,2,3,3744949492419081,10870575,50000
10、000550005550750050000000000000005005000000 0ent C ategoryC le ric a lC u s to d ia lMa n a g e rC u rre nt S a la ry上联表及Bar Chart涉及两个变量,即现工资与职务级别的二维交叉,反映了在不同的职务 级别下现工资的分布情况。上表中,职务级别成为行向量,现工资称为列向量。(2)单因素方差分析。单因素分析用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。下面我 们把受教育水平和起始工资作为控制变量,现工资为观测变量,通过单因素方差分析方法研究受教育水平和起始工资对现工
11、资的影响进行分析。分析结果如下:AN0VACurre nt SalarySum of SquaresdfMean SquareFSig.Betw een Groups1E+01189137063599533.040.000Within Groups2E+01038441484093.53Total1E+011473上表是起始工资对现工资的单因素方差分析结果。可以看出:F统计量的观测值为 33.040,对应的概率P值近似等于0,如果显著性水平为 0.05,由于概率值P小于显著性水平q,则 应拒绝原假设,认为不同的起始工资对现工资产生了显著影响。ANOVACurre nt SalarySum of
12、 SquaresdfMean SquareFSig.Betw een Groups9E+0109985039278592.779.000Within Groups5E+010464106170173.2Total1E+011473同理,上表是受教育水平对现工资影响的单因素分析结果,其结果亦为拒绝原假设,所以不同的受教育水平对现工资产生显著影响。4、相关分析。相关分析是分析客观事物之间关系的数量分析法,明确客观事物之间有怎 样的关系对理解和运用相关分析是极其重要的。函数关系是指两事物之间的一种对应的关系,即当一个变量 X取一定值时,另一个变量函数Y可以根据确定的函数取一定的值。 另一种普遍存在的
13、关系是统计关系。 统计关系 是指两事物之间的一种非对应的关系, 即当一个变量X取一定值时,另一个变量丫无法 根据确定的函数取一定的值。统计关系可分为线性关系和非线性关系。事物之间的函数关系比较容易分析和测度,而事物之间的统计关系却不像函数关系那样直接,但确实普遍存在,并且有的关系强有的关系弱,程度各有差异。如何测度事物之间的统计关系的强弱是人们关注的问题。相关分析正是一种简单易行的测度事物之间统计关系的 有效工具。Cor relationsCurrent SalaryBeginningSalaryMonths since HirePrevious Experience(months)Years
14、Current SalaryPearson Correlation1.880*.084-.097*-.144*Sig. (2-tailed).000.067.034.002N474474474474473Beginning SalaryPearson Correlation.880*1-.020.045-.010Sig. (2-tailed).000.668.327.833N474474474474473Months since HirePearson Correlation.084-.0201.003.054Sig. (2-tailed).067.668.948.244N4744744744
15、74473Previous ExperiencePearson Correlation-.097*.045.0031.802*(months)Sig. (2-tailed).034.327.948.000N474474474474473YearsPearson Correlation-.144*-.010.054.802*1Sig. (2-tailed).002.833.244.000N473473473473473*. Correlation is significant at the 0.01 level (2-tailed).* Correlation is significant at
16、 the 0.05 level (2-tailed).上表是对本次分析数据中,现工资、起始工资、本单位工作时间、以前工作时间、年龄五个变量间的相关分析,表中相关系数旁边有两个星号(* )的,表示显著性水平为 0.01时,仍拒绝原假设。一个星号(*)表示显著性水平为 0.05是仍拒绝原假设。 先以现工资这一变 量与其他变量的相关性为例分析, 由上表可知,现工资与起始工资的相关性最大, 相关系数 为0.880,而与在本单位的工作时间相关性最小,相关系数为0.084。5、参数检验。首先对现工资的分布做正态性检验,结果如下:1 21 062Me a n = $3 4 ,4 1 9.57S td. De
17、 v. = $1 7 ,0 7 5.66 1N = 47 4H is t o g r a m由上图可知,现工资的分布可近似看作符合正态分布,现推断现工资变量的平均值是否为 $3,000,0,因此可采取单样本t检验来进行分析。分析如下:One-Sample StatisticsNMeanStd.DeviationStd. ErrorMeanCurrent Salary474$34,419.57$17,075.661$784.311One-Sample TesttdfTest Value = 3000095% ConfidenceInterval of theDifferenceSig.(2-ta
18、iled)MeanDifferenceLowerUpperCurrent Salary5.635473.000$4,419.568$2,878.40$5,960.73由One-Sample Statistics 可知,474名职工的现工资平均值为Y34,419.57,标准差为$17,075.661,均值标准误差为$784.311。图表One-Sample Test中,第二列是t统计量的观 测值为5.635 ;第三列是自由度为 473 ( n-1 );第四列是t统计量观测值的双尾概率值;第 五列是样本均值和检验值的差;第六列和第七列是总体均值与原假设值差的95%的置信区间为($2,878.40,5,960.73)。该问题的t值等于5.635对应的临界置信水平为0,远远小于设置的0.05,因此拒绝原假设,表明该公司的474名职工的现工资与$3,000,0存在显著差异。6、非参数检验。对本数据中的年龄做正态分布检验,结果如下:rsa e 丫 f o -t p Q-QamroNm a g oH2 00Ye a r sMe a n = 47.14S td. Dev
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 6331:2024 EN Chromium ores and concentrates - Determination of chromium content - Titrimetric method
- 2024年度网络营销合同的网络推广策略与效果评估
- 2024年度版权转让合同转让标的和转让价格2篇
- 《偏瘫患者肩部问题》课件
- 2024年度劳动合同模板及管理制度2篇
- 2024年度碧桂园工程质量检测合同
- 2024年度区块链技术开发与应用合同3篇
- 2024年度羽毛球场地维修与保养合同
- 2024年度技术开发项目合作承包合同
- 2024年度工程设备租赁与维护服务合同
- 数字摄影技术与艺术中国大学mooc课后章节答案期末考试题库2023年
- 2023年叉车证特种设备作业N1证理论考试题库及答案
- 青年教师三年发展规划青年教师个人发展规划书3篇
- 传热学-7-凝结和沸腾传热课件
- 《药品储存与养护》期末考试习题库(含答案)
- 2023学年完整公开课版《母鸡的秘密》
- 固定资产的取得
- 血管瘤-教学讲解课件
- 5G基站建设与维护高职全套PPT完整教学课件
- 四位数乘四位数乘法题500道
- 陕西省XX实业有限公司文件公司章程
评论
0/150
提交评论