下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验二:EXCEL的数据特征描述、列联分析、多元回归分析一、实验目的及要求:(一)目的熟悉EXCEL用于数据描述统计、列联分析、多元回归的基本菜单操作及命令。(二)内容及要求根据学生实验数据12,对学生的身高进行描述统计,说明学生身高的一些基本特征。对不同专业中男女生的分布情况编制列联表,并分析学生性别与专业选择是否有关。根据学生的体育成绩任1)与学生的年龄(幻)、体重(、身高33)和性别34)建立一个 多元回归模型,并判断此模型对于解释学生体育成绩的好坏有无意义。二、仪器用具硬件:计算机(安装Windows98、Windows2000或Windows XP或以上)软件:EXCEL三、实验原理
2、统计中数据整理与显示的相关理论。四、实验方法与步骤(一)描述统计在“工具”中的“数据分析”选择“描述统计”,其中“输入区域”为“身高”歹U,注意要 是选中“身高”,要记得勾选“标志位于第一行”。(二)期望频数第一,在“数据”的“数据透视表和数据透视图”选择“数据透视表”,然后显示勾选“现 有工作表”中的“布局”,其中“布局”为依次将“专业”拖至“列”区域,将“性别”拖 至“行”区域,将“专业”拖至“数据”区域,至此完成,其结果显示如下:计数项:专业专业F男女忘统计6060120证券184260总普78102180第二,将做好的数据透视表“选择性粘贴”,要勾选“数据”和“转置”;第三,根据公式计
3、算出期望值,并绘制期望值和观察值表格,结果显示如下:观察值期望值6052606818264234选择函数“CHITEST”,“Actual_range”选中观察值数据,“Expected range”选中期望值 数据。(三)多元回归模型第一,新建“sheet4”,将“性别”“年龄”“体重” “身高”“体育成绩”四列复制,粘贴到 “sheet4”;第二,在“ sheet4 ”中将“性别”列复制,然后粘贴到现有工作表,其中要将“性别”改为 “代码”,在“编辑”中的“查找和替换”中用“0”替代“男”,用“1”替代“女”;第三,在空白列首行输入“Y”,选择“筛选”中的“自动筛选”其中“性别”为“男”在
4、“Y”列的空白格为“男生的体育成绩/1000”,同理可得女生的“Y”值为“女生的体育成绩 /800”;第四,在“工具”中的“数据分析”中选择“回归”然后在“Y值输入区域”选中“Y”列 数据;“X值输入区域”选中“代码”“年龄”“体重” “身高”四列数据,选择“选择输出区 域,至此完成。五、实验结果与数据处理(一)描述统计身高平均164.7722222标准误差0.595129756中位数163.5众数155标准差7.984503536、.儿方差63.75229671峰度-0.696982464偏度0.248125331区域36最小值150最大值186求和29659观测数180最大(1)186最小
5、(1)150置信度1.174372756(95.0%)从上述表中可以看出,学生中身高最高和最低的分别为186cm和150cm,其中平均身高 为164.772。出现最多次数的身高是155cm。还有学生身高的方差和标准差都比较大,说明 学生中身高差距大,分布比较不平衡。(二)经过excel统计得出如下列联表:不同专业中男女生的分布情况列联表性别专业男女总计统计6060120证券184260总计78102180根据计算结果得出,相关性为:0.089,即P=0.089040011a=0.05,因此学生性别与专业选择是相关的。(三)多元回归模型SUMMARY OUTPUT回归统计Multiple R0.
6、796934R Square0.635103Adjusted R Square0.626763标准误差0.02502观测值180方差分析dfSSMSFSignificance F回归分析4 0.1906710.04766876.146872.7701E-37残差1750.109550.000626总计179 0.300221Coefficients标准误差t StatP-valueLower 95%Upper 95Intercept0.404130.0826324.8907122.26E-060.241046220.5672XVariable10.0569310.0062019.1802391
7、.2E-160.04469160.069XVariable2-0.001670.002046-0.814810.416287-0.00570520.0023XVariable30.0003070.0003390.9047720.36683-0.00036260.0009XVariable4-0.000920.000427-2.151140.032836-0.0017631-7.6E-Adjusted R Square=0.626763,即解释力度为 62.6763%;F检验:将Significance F值(即P值)与给定的a =0.05进行比较,因为 Significance F=2.7701E-37a =0.05,所以学生的年龄、体重、身高和性别与学生的体育成绩之间的线性 关系显著;t检验:直接用p值进行比较,可以看出,其中有两个系数的p值大于0.05,即未通过检验, 因此说明力度不大;所以此模型对于解释学生体育成绩的好坏有一定的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 几何与艺术融合
- 音乐与认知能力的关系-洞察分析
- 医疗非织造布进展-洞察分析
- 疫情家具消费心理-洞察分析
- 睡眠障碍在更年期综合征中的作用研究-洞察分析
- 渔业政策与法规研究的报告-洞察分析
- 艺术与地域文化关联-洞察分析
- 渔业科技扶贫模式-洞察分析
- 《工作室模板》课件
- 2024年浙科版选修4化学上册阶段测试试卷
- 2024年7月国家开放大学法律事务专科《企业法务》期末纸质考试试题及答案
- 《教师法》培训课件
- 常用护理评估表及注意事项
- 河北省唐山地区2023-2024学年上学期期末八年级历史试卷
- 专题06直线与圆的位置关系、圆与圆的位置关系(课时训练)原卷版
- 军用装备信息化融合与互联
- 人才培养与团队建设计划三篇
- 2024年急性胰腺炎急诊诊治专家共识解读课件
- 六年级地方课程教案
- 【寒假预习】部编版二年级语文下册生字练字帖(带拼音、笔顺)
- 信息技术-计算机第三方支付行业深度报告:监管加速第三方支付合规及出清提费利润弹性巨大
评论
0/150
提交评论