版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据的基本统计与非参数检验北京建筑大学理学院信息与计算科学专业实验报告课程名称数据分析实验名称数据的基本统计与非参数检验实验地点基C-423日期2016.3 .17姓名一班级一学号一指导教师 成绩【实验目的】(1)熟悉数据的基本统计与非参数检验分析方法;(2)熟悉撰写数据分析报告的方法;(3)熟悉常用的数据分析软件SPSS【实验要求】根据各个题目的具体要求,完成实验报告【实验内容】根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分别对数据的“家庭收 入”、“现住面积”,进行数据的基本统计量分析,撰写相应的分析报告;根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分别
2、分析不同学历对家庭 收入、现住面积是否有显著影响,撰写相应的分析报告。根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分析家庭收入与10000元是 否有显著差异,撰写相应的分析报告。根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分析婚姻状况对家现住面 积是否有显著影响,撰写相应的分析报告。根据附件“减肥茶数据”给出的相关数据,请选用恰当的分析方法,分析该减肥茶对减肥是否有 显著影响,撰写相应的分析报告。【分析报告】表一家庭收入和现住面积的基本描述统计量家庭收入现住面积N有效29932993缺失00均值17696.156762.7241均值的标准误279.64310
3、.47349中值15000.000060.0000众数10000.0060.00标准差15298.8034125.90383方差2.341E8671.008偏度5.546.910偏度的标准误.045.045峰度55.4253.078峰度的标准误.089.089百分位数2510000.000045.00005015000.000060.00007520000.000080.0000表一说明,家庭收入方面:被调查者中家庭收入的均值为17696.16元,中值为15000元,普遍收入为10000元;家庭收入的标准差和方差都相对较大,所以,各家 庭 收入之间有明显的差异;偏度大于零,说明右偏;峰度大于零
4、,说明数据呈 尖 峰分布;由家庭收入的四分位数可知,25%的家庭,收入在10000以下,有50%的家庭,收入在15000以下,有75% 的家庭,收入在20000以下;现住面积方面:被调查者中现住面积的均值为62.724平方米,中值为 60平方米,普遍面积为60平方米;现住面积的标准差和方差都相对较大,所以,各家 庭 现住面积之间有明显的差异;偏度近似等于零,说明现住面积数据对称分布;峰度 大于零,说明现住面积数据为尖峰分布;由现住面积的四分位数可知,25%的家庭,现住面 积为 45平方米以下,有50%的家庭,现住面积在60平方米以 下,有75%的家庭,现住面积在80平方米以下。:坝皿电收入该图
5、表明,家庭收入分布存在一定的右偏表二:学历与现住面积的交叉表.0*怙.创-f理6Q oo图二:现住面积直方图该图形象的展示了现住面积的数据分布比标准正态分布 更陡峭new名息言十1.002.003.004.005.00文初中及以下言十敷化琪期言十敷程文化程度内的庄new内的估名息言十的百分比殛差榇莘殛差796779.298.9%27.5%26.6%16.8.6821.21.0%10.1%0.3%-13.2-2.912.20.1%12.5%0.0%-1.2-.801.10.0%0.0%0.0%-1.1-1.001.30.0%0.0%0.0%-1.3-1.2805805.0100.0%26.9%2
6、6.9%高中(中专)言十敷琪期言十敷文化程度内的new内的估名息言十的百分比殛差榇莘殛差12401217.698.6%42.8%41.4%22.4.61733.21.4%21.5%0.6%-16.2-2.813.40.1%12.5%0.0%-2.4-1.301.70.0%0.0%0.0%-1.7-1.302.10.0%0.0%0.0%-2.1-1.412581258.0100.0%42.0%42.0%大学(专、本科)言十敷琪期言十敷文化程度内的new内的估名息言十的百分比殛差榇莘殛差832867.392.9%28.7%27.8%-35.3-1.25123.65.7%64.6%1.7%27.45
7、.652.40.6%62.5%0.2%2.61.741.20.4%100.0%0.1%2.82.641.50.4%80.0%0.1%2.52.0896896.0100.0%29.9%29.9%研究生及以上言十敷琪期言十敷文化程度内的new内的估名息言十的百分比殛差榇莘殛差2932.985.3%1.0%1.0%-3.9-.73.98.8%3.8%0.1%2.12.21.12.9%12.5%0.0%.93.00.00.0%0.0%0.0%.0-.21.12.9%20.0%0.0%.94.03434.0100.0%1.1%1.1%琪期言十敷文化程度内的new内的估名息言十的百分比28972897.0
8、96.8%100.0%96.8%7979.02.6%100.0%2.6%88.00.3%100.0%0.3%44.00.1%100.0%0.1%55.00.2%100.0%0.2%29932993.0100.0%100.0%100.0%2慨跖i图三:学历与家庭收入直方图表二表明:首先,在所调查的2993个样本中,805个样本为 初中及以下学历,1258为高中(中专)学历,896为大学(专,本科)学历,34为研究生及以上学历,分别占总样本的26.9%,42%,29.9%,和1.1%,可见高中学历居多;收入为05w,5w10w,10w15w,15w20w,20w25w 的样本量分别为2897,79
9、,8,4,5,各占样本的96.8%,2.6% 0.3%,0.1%,0.2%,收入在05w的占较大比例。其次,对不同学历进行分析。在初中及以下学历中,98.9%的家庭收入在5万以下,1%的家庭收入在5w10w之间;在高中学历中98.6%的家庭收入在5万以下,1.4%的家庭收入在5w10w之间;在大学学历中92.9%的家庭 收入在5万以下,5.7%的在5w10w之间;在研究生及以 上学历中85.3%的家庭收入在5万以下,8.8%的家庭收入-7 -在5w 10w,2.9%的家庭收入在10w15w之间。最后,对家庭收入进行分析。在家庭收入为5w(2897)以下的样本中,学历为研究生及以上学历的最少,为
10、 29;其他家庭收入中,大学学历的占大多数。由此可以得出,学 历与家庭收入有一定的联系。但是,样 本中的各学历的样本量存 在一定的悬殊。这些结论从图中可以直观的展现出来。表三:不同学历的家庭收入的一致性检验结果敷值df渐近著性端)(2皮懈森(Pearson)卡方102.257 a12.000概似比81.38712.000性封性聊60.1431.000有效察值彳固敷2993a. 13 S料格(65.0%)琪期言十敷小於5。琪期的言十敷下限舄.05。本检验的原假设是:不同学历对家庭收入是否有显著影响。如果显著性水平a设为005,由于卡方的概率p-值小于a, 因此应拒绝假设,认为不同学历与家庭收入是
11、否无显著影响。这 种无影响主要体现在家庭收入低的比例在低学历中低于总体比 例,而家庭收入高的在比例在 低学历中高于总体比例表四:学历与现住面积交叉表square名息言十1.002.003.004.005.00初中及以下4733072401805化琪期言十敷380.0397.526.6.5.3805.0程文化程度内的58.8%38.1%3.0%0.0%0.1%100.0%度square 内的 33.5%20.8%24.2%0.0%100.0%26.9%估名息言十的百分比15.8%10.3%0.8%0.0%0.0%26.9%殛差93.0-90.5-2.6-.5.7榇莘殛差4.8-4.5-.5-.7
12、1.4高中(中专)65857425101258琪期言十敷593.9621.241.6.8.41258.0文化程度内的52.3%45.6%2.0%0.1%0.0%100.0%square 内的 46.6%38.8%25.3%50.0%0.0%42.0%估名息言十的百分比22.0%19.2%0.8%0.0%0.0%42.0%殛差64.1-47.2-16.6.2-.4榇莘殛差2.6-1.9-2.6.2-.6大学(专、本科)2735734910896琪期言十敷423.0442.529.6.6.3896.0文化程度内的30.5%64.0%5.5%0.1%0.0%100.0%square 内的 19.3%
13、38.8%49.5%50.0%0.0%29.9%估名息言十的百分比9.1%19.1%1.6%0.0%0.0%29.9%殛差-150.0130.519.4.4-.3榇莘殛差-7.36.23.6.5-.5研究生及以上92410034琪期言十敷16.116.81.1.0.034.0文化程度内的26.5%70.6%2.9%0.0%0.0%100.0%square 内的 0.6%1.6%1.0%0.0%0.0%1.1%估名息言十的百分比0.3%0.8%0.0%0.0%0.0%1.1%殛差-7.17.2-.1.0.0榇莘殛差-1.81.8-.1-.2-.1名息言十1413147899212993琪期言十敷
14、1413.01478.099.02.01.02993.0文化程度内的47.2%49.4%3.3%0.1%0.0%100.0%square 内的 100.0%100.0%100.0%100.0%100.0%100.0%估名息言十的百分比47.2%49.4%3.3%0.1%0.0%100.0%图四:不同学历与现住面积的直方图表四表明:首先,在所调查的2993个样本中,805个样本为初中及以 下学历,1258为高中(中专)学历,896为大学(专,本科)学 历,34为研究生及以上学历,分别占总样本的26.9%,42%, 29.9%,和1.1%,可见高中学历居多;现住面积为060m2, 60 120m2
15、,120 180m2,180 240m2,240 300m2 的样本量分 别为 1413,1478,99,2,1 各占样本的 47.2%,49.4%, 3.3%,0.1%,0.0%,现住面积在第一和第二种情况下居多。其次,对不同学历进行分析。在初中及以下学历中,58.8% 的现住面积为60m2以下,38.1%的现住面积在60120m2之间,3%的 现住面积在120180m2之间;在高 中学历中,52.3%的现住面积 为60m2以下,45.6%的现 住面积在60120m2之间,2%的现住面 积在120180m2之 间;在大学学历中,30.5%的现住面积为60m2 以下,64%的现住面积在6012
16、0m2之间,5.5%的现住面积在120180m2之间;在研究生及以上学历中,26.5%的现住 面积为 60m2以下,70.6%的现住面积在60120m2之 间,2.9%的现住面积在120180m2之间。最后,对家庭收入进行分析。在现住面积为60m2以下及60 120m2的样本中,学历为高中的占大多数;在现住面积120 180m2的样本中,大学学历的占大多数。由此可以得出,学历与 家庭收入有一定的联系。但是,样本中的各学历的样本量存在一 定的悬殊。这些结论从图四中可以直观的展现出来。表四:不同学历的现住面积的一致性检验结果渐近著性 (2敷值df端)皮懈森(Pearson)卡方174.891 a1
17、2.000概似比178.93812.000性封性聊131.4291.000有效察值彳固敷2993a. 9资料格(45.0%)琪期言十敷小於5。琪期的言十敷下限舄.01。本检验的原假设是:不同学历对现住面积是否有显著影 响。如果显著性水平a设为0.05,由于卡方的概率p-值小于a, 因此应拒绝假设,认为现住面积与家庭收入是否无显著影响。这 种无影响主要体现在现住面积小的比例在低学历中低于总体比 例,而现住面积大的在比例在 低学历中高于总体比例。表五:家庭收入的统计资料N平均敷榇率偏差榇莘金昔森平均值家庭收入299317696.156715298.80341279.64310表六:家庭收入的检定检
18、定值=10000Tdf著性(燮尾)平均差巽95%差巽敷的信赖匾冏下限上限家庭收入-4 -/-t H27.5212992.0007696.156707147.84458244.4689 ,仃696元,标准差为15298.8元,均值标准误差为279.64。由表六可知,第二列七统计量的观测值为27.521;第三 列的自由度为2992;第四列的t统计量的观测值的双 尾概率P- 值为0;第六列和第七列是总体均值与原假设值 差的95%的置信 区间(7147.84,8244.47,由此计算出 总体均值的95%的置信区 间为(8147.84,9244.47 元。该问题应采用双尾检验,因此比较a/2与p/2,也
19、就 是比 较a与p。如果a取0.05,由于p小于0.05,因此拒绝假设,认 为家庭收入的平均值与10000元有显著的差异。95%的置信区间 告诉我们有95%的把握人为家庭收入的均值在8147.84 9244.47元之间,10000元没有包含在置信 区间内,也证实了上 述推断。表七:婚姻状况的统计量婚姻N均值标准差均值的标准误现住面积已婚268563.114925.88033.49946表七:婚姻状况的统计量婚姻N均值标准差均值的标准误现住面积已婚268563.114925.88033.49946否30859.316825.900741.47583表八:婚姻状况与家庭收入显著性的检验方差方程的L
20、evene检验均值方程的t检验FSig.tdfSig.(双侧)均值差值标准误差值差分的95%置信区间下限上限现住面积假设方差相等假设方差不相等.410.5222.4392.4382991380.778.015.0153.798153.798151.557081.55806.74510.734686.851216.86162表八是已婚和未婚家庭现住面积的均值检验结果第一步,该检验的F统计量为0.410,对应的概率为0.522.如 果显著水平a为0.05,由于概率P值大于005,可以认 为两 总体的方差无显著差异。第二步,由于两样本方差 无显著差 异,因此应看第三行t检验的结果。其中,t统计量的观测值 为2.439,对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 精装修住房出租合同
- 恒大地产总承包合同正规范本
- 建筑施工服务合同范本
- 信托资金借款合同书格式范本
- 房地产分期付款合同范本
- 《税务培训课件》资料
- 财税基础知识培训
- 无论何时纸质合同更加安全的总结陈词
- 3人合伙合同范本
- 中医个人实习总结
- 新教材人教版高中物理选择性必修第三册全册各章节知识点考点
- CJT 354-2010 城市轨道交通车辆空调、采暖及通风装置技术条件
- 暑假作业 11 高二英语语法填空20篇(原卷版)-【暑假分层作业】2024年高二英语暑假培优练(人教版2019)
- 2024年江西省南昌市南昌县中考一模数学试题(含解析)
- 绘本的分镜设计-分镜的编排
- 查干淖尔一号井环评
- 体检中心分析报告
- 人教版初中英语七八九全部单词(打印版)
- 最高人民法院婚姻法司法解释(二)的理解与适用
- 关于医保应急预案
- 新人教版五年级上册数学应用题大全doc
评论
0/150
提交评论