统计学实验步骤总结与心得分析报告_第1页
统计学实验步骤总结与心得分析报告_第2页
统计学实验步骤总结与心得分析报告_第3页
统计学实验步骤总结与心得分析报告_第4页
统计学实验步骤总结与心得分析报告_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、姓名: 学号:班级: 成绩 一、实验步骤总结 成绩 (一)数据的搜集与整理数据的收集1)、间接搜集专业数据库网站搜集通过搜索 引擎猎取二手资料 2)、直接搜集(1)统计调查或观看普查重点调查典型调查抽样调查等 (2)实验2、数据整理 1)、数据的编码(1)封闭式问题预编码 (2)开放式问题排列、合并及设码三个过程来完成编码工作 2)、数据的录入单激单元格数据录入利用鼠标或键盘指示进行单元格切换3)、数据文件的导入菜单栏数据导入外部数据选择文件4)、数据的筛选菜单栏筛选自动筛选高级筛选5)、数据的排序菜单栏数据排序降序排序升序排序6)、数据文件的保存文件(保存)文件(另存为)注意:数据进行复制时

2、,可通过单击右键进行选择性粘贴,选择数值及转置可改变数值粘贴时的方向 (二)描述数据的图表方法1、频数频率表 1)、 Frequency 函数(1)用途:以一列垂直数组返回某个区域中数据的频率分布 (2)语法:FREQUENCY(data_array,bins_array)(3)参数:data_array与bins_array的用法(4)工具栏插入函数统计frequency选择参数操作的范围 注意:使用组合键“Ctrl+Shift+Enter” 2)、直方图分析工具:工具数据分析直方图2、统计图 (1)直方图:A、调用图形向导 B、以组中值作横轴,频率做纵轴 C、对纵横轴等进行修正(包含变量名

3、称的要选中标志一栏) (2)折线图:用于比较几组数据选择要进行绘图的数据菜单栏第二栏选择图表向导导出图形 (3)散点图:反映两组数值变量间的可能关系(步骤同折线图) 3、数据分析及函数比较:数据分析适用于一次输入,而函数比较适用于多次输入,依据原始数据的调整输出结果(三)统计数据的描述1、函数描述:1)、 Average计算指定序列算数平均数 2)、 Geomen计算数据区域的几何平均数3)、 Stdev计算样本标准差4)、 Stdevp总体的标准差(1)一般比样本标准差小(2)假如明确明白参数即为样本全集则不能使用样本计算函数,否则误差较大5)、 Max计算最大值6)、 Min计算最小值7)

4、、 Quartile计算四分位点(1)参数array及quart(只同意输入四个值) (2) 关于第一个四分位数及中位数要求数据进行排序8)、Percentile计算百分数位置数值(1)参数array及k(k取决于输入样本的大小)9)、 Var计算样本的方差10)、Varp计算总体的方差11)、Skew反映数据对称与否情况(左偏或右偏或对称) 12)、Kurt反映数据的陡缓情况(1)并非计算原始数据的峰度,而是相关于正态分布 (2)数据与标准正态峰度3或-3进行比较显示其凸凹性2、”描述统计”工具使用:工具数据分析描述统计1)、Count计算参数的个数(同意选择非数值单元格,但只计算数值型单元

5、格个数)2)、第K大值及第K小值工具数据分析描述分析标志(可描述针对哪个变量作特征描述将会自动给数据特征取名字)第K大值按降序顺序排列,第K小值按升序排列 3)、标准误差:StdevSqurt(count)假如使用fx计算嵌套函数容易出错,因此一般手工输入 4)、平均数置信度参数可能(四)参数可能:1、抽样:工具-数据分析-抽样(使用抽样数据分析库只能对一个变量展示抽样结果)2、参数可能:1)点可能(默认为样本均值即为点均值) 2)区间可能A、Confident返回总体平均值的置信水平1)参数:alpha,standarddev,size2)方差已知,大小样本可用函数可能;方差未知,大样本只适

6、用于Z可能B、Tinv返回作为概率和自由度函数的t分布的t值参数probability,degreesfreedomC、Normtinv返回标准正态分布累积函数的逆函数参数probability D、ABS求出相应数字的绝对值参数numberE、Chiinv返回卡方分布单尾概率的逆函数参数probability,degrees_freedom3)参数可能步骤a、明确可能的条件(样本个数、均值及标准差) b、构建样本统计量 c、明确样本一般服从如何样的分布 d、置信水平(手动输入) e、平均误差(自由度) f、得到半径,构建置信区间(五)假设检验:1、假设检验的函数表单1)、构建函数表单函数表单

7、构建的一般思路:A、确定需进行假设检验的总体参数B、确定抽样样本统计量及其服从的分布C、进行假设设计(单侧,双侧) a、手动输入假设检测类型 b、输入函数count、average以构建参数统计量c、手动输入“用户输入”三项内容D、确定置信水平(手动输入)E、计算检验统计量(以计算抽样平均误差抽样数据与总体均值之间差异)F、计算置信水平下的检验区间(或检验临界值)G、比较检验统计量与检验区间(或检验临界值) 得出结论注意:两个临界值外则拒绝原假设2、分析工具库1)、F-检验:双样本方差:该工具通过双样本的F检验,对两个样本的方差进行比较。用于讲明两个样本的方差是否存在显著差异。2)、t-检验:

8、A、 双样本等方差假设:在一定置信水平之下,均值检验,比较两个总体均值之差。注意:假设平均差在原假设中已被给出。 B、双样本异方差假设:该分析工具能够进行双样本t-检验,也称作异方差t-检验。能够使用t-检验来确定两个样本均值实际上是否相等。当进行分析的样本个数不同时,可使用此检验。假如某一样本组在某次处理前后都进行了检验,则应使用“成对检验”。 C、成对双样本均值分析:该分析工具能够进行成对双样本t-检验,用来确定样本均值是否不等。 3)、 Z-检验:双样本均值分析:能够进行方差已知的双样本均值z-检验。此工具用于检验两个总体均值之间存在差异的假设。4)、步骤:工具数据分析F检验T检验Z检验

9、(六)方差分析1、单因素方差分析1)、步骤:工具数据分析单因素方差分析输入位置选中数据输出区域激活单元格确定2)、注意:默认以列输出,a默认为0.05在差异源处即可下是否拒绝原假设的结论2、无重复双因素方差分析1)、步骤同上2)、注意:拒绝原假设代表两个列表存在特不大差异 若要找出产生阻碍的样本必须使用LSD两两比较3、可重复双因素方差分析 1)、步骤同上2)、注意:每一样本行数可设定 相同数据一般在行中显示 反复试验的次数相等(七)相关与回归分析:1)、利用correl计算相关系数 : A、语法:CORREL(array1,array2) B、注意:两个数据差不多上随机变量,无所谓自变量或因

10、变量。2、相关系数分析工具法:1)、步骤:工具-数据分析-相关系数2)、注意:只反映线性相关。 “1”代表自相关性3、回归分析的函数方法: 1)、Intercept返回线性回归模型的截距2)、Slope返回线性回归模型的斜率3)、Forecast返回一元线性回归模型的预测值4)、Steyx 计算可能的标准误差单值函数,只能计算一个结果。 5)、Trend计算线性回归线的趋势值为多值预测6)、Growth返回指数曲线的趋势值7)、Linest 返回线性回归模型的参数8)、Logest 返回指数曲线模型的参数与GROWTH配套,返回指数模型4、“回归”分析工具1)、步骤:工具数据分析回归Y值输入因

11、变量,X值输入自变量选中置信度(默认,可修改)确定2)、注意:假如significance-F拒绝原假设,代表拟合程度较高。 p-value要紧与置信水平进行比较。(八)时刻序列分析1、测定增长量和平均增长量步骤:激活单元格输入公式回车得出结果拖拉权柄得出下面的结果 2、测定进展速度和平均进展速度3、计算长期趋势4、计算季节变动5、用移动平均法进行预测A奇数项输入average公式回车返回结果拖拉权柄B偶数项激活偶数个单元格输入公式向下拖拉激活右侧另外一列单元格再次输入公式进行二项修正6、用指数平滑法进行预测7、趋势预测法进行预测:1)、 Forecast函数参数:X、known_ys,kno

12、wn_xs2)、Trend函数参数:known_ys,known_xs,new_xs,const二、实验心得报告 成 绩 通过十六个学时的学习,我对统计学实验由不明白到深入了解,那个过程是需要付出一定的努力的。而这段时刻的学习也让我受益匪浅,特不是在学习及工作中,统计学实验课上的内容对各方面的关心都特不大。 首先谈谈我对统计学这门课程的理解。统计,用我自己的话讲,便是通过数据的搜集整理形成各项组数的数据,再利用专业方式及方法对数据进行分析与归纳。社会的各个领域都离不开数字,而有数字的领域就一定会涉及到统计,包括社会,科学,教育,文化,政治等等方面,我们都需要对其进行周密的分析,比如人均生活水平

13、、工业农业进展水平、国民生产总值、出口贸易总值等等。而人们的生活水平是否有提高?出口贸易呈现如何样的增长?这些种种数据只有通过专业方法的分析才能将其内部体现的深层次的数据探究出来,以便我们做好下一步的预算或者讲决策。因此,统计学有一股强大的吸引力指引着我向它靠近。 现在举一个印象较为深刻的例子。作为学院早操章的负责人,我们需要每个月对每个班早操的出勤状况进行统计,这便涉及到数据的搜集。首先我们将学院同学的早操表上收(这些作为统计的原始数据是特不必要的),其次,我们通过对原始数据的统计将每个班的出勤状况的各种数据通过一定的计算公式得出下表:班级未交表不合格人数不合格率(缺5个及以上)合格人数合格

14、率全勤人数全勤率工商110100034100%2985.29%工商110200035100%3497.14%治理110100032100%2268.75%治理110200031100%31100%营销110100023100%1565.22%营销1102012.57%3897.43%3076.92%营销11030000100%2683.87%会计11012611.77%4588.23%2452.94%会计1102147.41%5092.59%3157.40%会计1103123.71%5296.29%3666.66%会计1104012.18%4597.82%3269.56%国贸1101139.6

15、7%2890.33%1754.83%国贸1102112.86%3497.14%1954.29%经济11011818.18%3681.82%1750.00%经济11024511.90%3788.10%1535.71%经济1103337.14%3992.86%12.38%信管11014412.90%2787.10%1341.93%信管1102226.45%2993.55%1961.29%商务1101227.14%2692.86%725.00%商务11022414.29%2485.71%1657.14%物流11012510.42%4389.58%1837.50%物流1102236.67%4293.3

16、3%2964.44%不难看出,上表数据较为杂乱,而通过EXCEL表格中数据导入的功能将以上数据导入至软件中,通过一定的电脑程序处理,比如我们需要统计出勤率前三名的班级,即可在菜单栏中点入数据排序。在排序的功能栏中选中要紧关键字为全勤率,即可找出出勤率排名前三位的班级。那个小小的例子仅仅体现的是我在工作中运用到统计实验的知识内容,但确实使我的工作达到了事半功倍的效果。下面以我班十位同学三门成绩作为分析对象进行一个系统的分析,以便在今后的学习当中有针对性的加强练习。首先输入数据至excel表格中学号英语高等数学会计学原理201021917198902010219283739520102193887

17、49520102194828795201021959093952010219681858520102197929985201021988283952010219980919520102200777595以英语成绩为例,将其制成柱状图。选中学号及英语成绩,点击图形向导,选中柱状图在数据标志坐标轴等选项内可选择对图形要紧信息的标志,比如选中数据标志的值选项,可在图形中反映出具体数值。为了更好地反映数值之间的差距,在坐标轴处点击右键选中坐标轴格式,在刻度一栏调高最小值,刻度即可从60分开始向上累计。我们再以高等数学为例,为了更好地反映高数成绩各个区间段的分布,我们能够调用Frequency函数。先设

18、定每个区间的间距(即组距),并纵向输入到表格中,在右侧空白处激活相同数量的单元格,在data-array一栏选中要分析的数据,在bins-array中选中此前分的组距,点击确定即可获得相应数据,运用拖拉权柄向下拉菜单表格,即可得出全部相应组数的频数。而同时我们希望计算出相应的频率时,可选择手动输入函数,激活I2单元格,输入“=H2/SUM($H$2:$H$5)”,即可算出第一组所占比例,运用拖拉权柄即可得出其他组数的结果。同时我们也能够将其反映至饼状图上,以便更清晰地看出各区域的分布。由此我们能够看出同学们在高数成绩上学习效果较好,假如班上有50名同学,可从这十名同学的成绩中推断出,大概有20

19、名同学的成绩位于90分以上。然而依旧有成绩较为落后的同学,据推断,有5名同学位于70分以下,这一部分同学假如不努力,将不能成功拿到学位证,因此我们要实行相应措施关心这一部分同学。现在我们来总体比较一下三门成绩的具体情况。点击工具数据分析描述统计选中输入数据选中标志位于第一行激活一个空白单元格将其选为输出区域确定,即可得出下表。英语高等数学会计学原理平均82.6平均84.2平均92.5标准误差1.9675标准误差3.57708758标准误差1.3437中位数82中位数86中位数95众数82众数#N/A众数95标准差6.2218标准差11.31174414标准差4.2492方差38.711方差12

20、7.9555556方差18.056峰度0.1464峰度-1.49073968峰度0.1065偏度-0.211偏度-0.13866238偏度-1.358区域21区域32区域10最小值71最小值67最小值85最大值92最大值99最大值95求和826求和842求和925观测数10观测数10观测数10最大(1)92最大(1)99最大(1)95最小(1)71最小(1)67最小(1)85置信度(95.0%)4.4508置信度(95%)8.091934275置信度(95.0%)3.0397从数据中我们不难看出,会计学原理的平均分最高,而同时通过标准差也可看出会计学原理的成绩离差最小,即同学们在这门课程中的水

21、平较为相当。而相反,高数成绩的偏差较大,即代表同学们在这门课程中差距较大,分差较为明显,也代表着高等数学这门课程是最容易拉出差距的,因此一些同学想要提高综合成绩,能够从高等数学着手。因此我们也不能忽视其中存在的问题,高数成绩相差较远,这阻碍到班级成绩的总体水平,班级的“一帮一”小组必须积极采取行动,怎么讲高数所占学分较重,评比优秀班级集体是容易拉开差距,因此我们必须积极关心那些在高数水平上相对落后的同学。英语作为我们交流的工具在现实生活中也起着特不重要的作用,而从平均分中不难看出,英语成为我们班相对较弱的科目,总体水平都处于中间状态,因此我们需要采取措施提高我班的英语总体水平,从下学期开始,我们预备成立英语学习小组,每周三晚定期做英语角活动,不仅能够提高同学们的英语口语能力,同时增进互相之间的感情。抽取的样本并不能完全代表总体的水平,因此我们还需要做一些方面的分析。以会计学原理成绩为例,将会计学原理标志改名为“样本数据”,选中A2至A11单元格点击插入名称指定首行,依次输入下列函数及公式由于总体标准差未知,因此选用小样本总体方差未知的函数表单方法。最终得出以下结论:因此通过参数可能一章学习的知识能够借助样本可能出全班同学的大致水平。通过置信区间上下限能够可能出全班同学的成绩上下差距。通过科学的统计方法专门快就得出了成绩分析的结论。这些衍伸数据关于我们进一步分析成绩水平起

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论