统计学实验报告_第1页
统计学实验报告_第2页
统计学实验报告_第3页
统计学实验报告_第4页
统计学实验报告_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学实验报告实验一 数据的搜集与整理一、数据的收集。统计数据主要来源于两种渠道: 一种是间接数据,这些数据来源于别人的调查或实验数据; 另一种是直接数据来源于直接的调查获取, 并进行相关的整理、研究得来的统计数据。间接数据的搜集方法有两种:第一是直接进入专业数据库网站查询数据, 这种方法主要适用于目标明确并且能够找到对应专业数据库网站的一些数据;例: 1,进入浏览器输入 2,在统计数据年度数据中选择统计年鉴2008 年数据下载后即可得到数据。第二种是使用搜索引擎, 适用于目标不明确并且数据库网站又没有直接提供的统计数据。例, 1,在百度中输入所需输入的信息名称2,在搜索项中点击第一项成都市的

2、统计局,进入统计数据。即可擦看到成都市统计局关于 2008 年成都人口数的下载表直接数据。这一类数据的收集获得途径有:科学实验、观察实验或者是直接调查。二、数据的整理数据的整理包括:数据编码、数据录入、数据文件的导入、数据的筛选、数据的排序以及数据文件的保存。( 1) 数 据的编码,数据编码是指把需要加工处理的数据库信息,用特写的数字来表示的一种技术是根据一定数据结构和目标特征, 将数据转换为代码或码字符, 在数据传输中表示数据组成,并作为送、接受和处理的一组规则和约定。( 2) 数 据的录入,数据的录入是将搜集到的数据直接输入到 Excel中。( 3) 数 据的导入:方法一:是使用“文件-

3、打开”菜单,方法二:是使用“数据-导入外部数据- 导入数据 ”( 4) 据的筛选数据的筛选是从大数据表单中选出分析所要用的数据。 Excel中提供了两种数据的筛选操作,包括“自动筛选”和“高级筛选” 。( 5) 据的排序数据的排序主要依靠升序排列或者是降序排列工具按钮和数据- 排序菜单实现。在选中排序的区域后,点击升序排列或者降序排列按钮,即可进行快速的排列。( 6) 据文件的保存可以使用“保存”工具按钮,或者“文件- 保存”菜单,还可以使用“文件 - 另存为”菜单。实验二,描述数据的图表。1,频数频率表ferquency 函数意义: 返回某一个选定区域中数据的频数分布, 计算出给定的值域和接

4、收与内,每个区间包含的数据个数。实验操作步骤:第一步:激活单元格并输入数据。第二布:选中未使用的单元格,点击函数调用卡片选择Frequency 函数。第三步: 点击 “插入函数” 对话框确定按钮进入 “函数参数” 对话框。引用 date-array 用来计算频率的一个数组。第四步:使用组合键“ Ctrl+Shift+Enter ”得到频数返回结果直方图分析工具:“工具”“数据分析”“直方图”直方图制作:第一步:将数据输入到单元格。第二步: 使用 “工具数据分析” 菜单, 打开 “数据分析” 对话框,选择“直方图” 。第三步: 单击确定按钮, 进入 “直方图” 分析工具库对话框, 点击 “输入区

5、域”右侧箭头选中输入数据的单元格,点击“接受区域”右侧箭头选中分组数据分单元格, “输出区域”只需要激活一个右侧和下侧都没有数据的单元格,选中图标输出和累计百分比。点即确定后就出现了统计图,再对统计图进行部分修改即可。饼子图制作 第一步:选择组别按住 crlt 点击图表导向。第二步:点击“数据标志”选项卡,选中值和百分比。最后点击确定即可。在工具-数据分析里选择饼图。或者如直方图的制作,各种统计图的各自特点。1,直方图:不支持手工输入,用来卡分布装抗2,折线图:用来比较分心两组即以上的数据。3,散点图:用来观察数据之间共同的变化趋势。实验三、统计数据的描述统计指标中包括众多的函数,包括算数平均

6、数,调和平均数,集合平均数,众数,中位数,标准差,方差,偏度,还有风度等。1,均值。1 算数平均数激活一空白单元格,输入公式敲击回车2 几何平均数 使用GEOMEAN法 求目标的几何平均数3 中位数 使用 median 函数 计算中位数4 众数使用mode进行计算2,离散程度。1 极差 max 计算最大值Min计算最小值通过max-min构建函数组算出极差2 方差和标准差Varp 计算方差Var 估算样本的方差Stdevp 返回整个总体的标准差Stdev 估计样本的标准差操作步骤:1 算术平均数:第一步,激活空白单元格,点击函数卡片选择该函数点即确定第二部:点击选择区域按钮拖选区域点击确定后就

7、出现平均值。其他如调和平均数,集合平均数,众数(MOD三中位数(MEDIAM)标准差 (stdev) ,方差 (var) ,偏度 (skew) ,还有风度(kurt) 等操作步骤相同,在点击函数卡片后选择对应的函数即可进行计算。2 : 描述统计 工具第一步:工具数据分析描述统计点击数据分析对话框第二部:进入“描述统计”对话框,分别选中输入输出区域。第三部:分组方式,选择“逐列”,输出区域选择一个右方和下方都没有数据的单元格,点“标志位于第一行”、“击汇总区域”、“平均数置信度”、“第K大值”、“第K小值”。几点说明( 1)观 测 值 , 计 算 数 组 数 据 的 个 数 , 使 用 函 数C

8、OUNT(values1,values2,),其中只有数值型的数据才能被统计。( 2)第k 大值和第 k 小值,第 k 大值是对数据按将序排列,对数据按升序排列。( 2)标准误差,使用Count 、 Stdev 和 Sqrt 三个函数组合套用来计算标准误差,返回某一正数的算术平方根,使用的函数是SQRTnumber)3)平均置信度,选中平均置信度复选框,手工输入置信度。实验死、参数估计1、抽样: “抽样”分析工具将输入区域视为总体,并使用总体来建立样本。当总体过大而无法处理或制成图表时,就可以使用代表样本。如果输入数据是周期性的, 也可以建立只包含某个周期特定部分数值的样本。第一步。在工具中选

9、择数据分析到数据数发生器。第二部,根据要求,进行随机数的发生。第三步:打开“工具数据分析抽样”点击确定第四步:选择索要数据的输入区域,样本单位个数,并在一个右方和下方没有数据的单元格确定输出数据,点击确定。二、构建函数表单在第一数列输入:样本统计量、样本个数、样本均值、用户输入、总体标准差、置信水平、计算结果、抽样平均误差、 Z 值、置信区间半径、置信区间下限、置信区间上限第二部:在选择相对应的项目后。点击插入名称指定,然后选最左列复选框,再点击确定。第三步:选中函数表中的所有单元格,点击插入名称指定,然后选最左列复选框,第四步:样本个数=count( 样本数据 )样本均值 =average(

10、 样本数据 )抽样平均误差=总体标准差/sqrt (样本个数)Z 值 =(样本均值总体均值假设值)/ 抽样平均误差)置信区间下限( =Normsive(1- 置信水平 )/2 ) )置信区间上限( =normsive( (1-置信水平) /2)+ 置信水平)置信区间半径( 100* ( 1-a) %,总体标准差,样本个数)最后确定。三、返回总体平均值的置信区间半径:第一步:点击置信区间半径所在行的空白单元格,点击函数卡片,找到“ confidence ”函数,点击确定。第二步:在Alpha 中填入用于计算的置信度,在standard_dev 中填入数据的总体标准差, size 为样本容量。四、

11、返回标准正态累积分布函数第一步:在“ Z 值”所在行选择空白单元格,点击函数卡片 , 找到normsinv 函数,点击确定。第二步:在“ probability ”中输入 0.95 (置信区间),然后点击确定五、返回作为概率和自由度的函数的 t 分布的 t 值第一步:在t 值所在行选择空白单元格,点击函数卡片 , 找到“ tinv ”函数,点击确定。第二步:在“ probability ”中填入显著性水平,在“ deg_freedom ”中填入比样本个数少一个的值,然后点击确定。实验五 假设检验一、总体标准差已知,总体均值的假设检验一一Z检验1,抽样。抽样: “抽样”分析工具将输入区域视为总体

12、,并使用总体来建立样本。 当总体过大而无法处理或制成图表时, 就可以使用代表样本。 如果输入数据是周期性的, 也可以建立只包含某个周期特定部分数值的样本。第一步。在工具中选择数据分析到数据数发生器。第二部,根据要求,进行随机数的发生。第三步: 根据所需要的数据要求选择变一个数, 总体单位, 获得数据 。2 构建函数表单第一步: 确定需进行一设检验的总体参数, 确定抽样样本统计量及其服从的分布(正态分布、 t 分布、 f 分布、卡方分布等) ,进行双侧或单侧一设设计,确定置信水平。第二部:抽样平均误差( =总体标准差/sqrt (样本个数)检验统计量(=(样本均值总体均值一设值)/ 抽样平均误差

13、)检验区间下限( =Normsive(1- 置信水平 )/2 ) )检验区间上限( =normsive( (1-置信水平) /2)+ 置信水平)第三部:得出结论。实验六,方差分析1,单因素方差分析:第一步:使用工具数据分析菜单,打开数据分析,选择方差分析单因素方差分析分析工具,确定第二部: 打开方差分析单因素方差分析; 输入区域要确定进行单因素方差分析数据所在单元格;分组方式的行、列单选框,确认分组总体数据是以行还是以列来划分; “标志位于”复选框确认输入区域数据是否包含标志; a 框要求输入显著性系数,输出区域选择输出单元格。第三部 点击方差分析:单因素方差分析分析工具的返回结果由两部分构成

14、:一部分是Summary汇总),以表格的形式展示出每个组的观测数、求和、平均和方差结果;第二部分是方差分析表。判断条件一:在一个给定的显著性水平a,如果计算的F检验统计量大于 F 的临界值就拒绝原假设,反之,不拒绝原假设。判断条件二:在一个给定的显著性水平a,如果P值小于a就拒绝原假设,反之,不拒绝原假设。2、无重复双因素方差分析第一步: 使用 “工具数据分析” 菜单打开数据分析对话框, 选择 “方 差分析无重复双因素方差分析”分析工具,点击确定打开对话框。第二部: 输入区域要确认进行无重复交互作用的双因素方差分析数据所在的单元格; “标志”复选框确认输入区域是否包含标志复选框; a框输入显著

15、性系数;输出区域选择输出单元格。第三部:点击“方差分析:无重复双因素方差分析”点击确定3、可重复双因素方差分析第一步:使用工具数据分”菜单打开数据分析对话框,选择“方差分析可重复双因素方差分析”分析工具,点击确定打开对话框。第二部: 输入区域要确认进行无重复交互作用的双因素方差分析数据所在的单元格; “标志”复选框确认输入区域是否包含标志复选框; a框输入显著性系数;输出区域选择输出单元格。第三部:点击“方差分析:可重复双因素方差分析”点击确定。判断条件: 在一个给定的显著性水平a 下, 如果计算的 F 检验统计量大于F的临界值,行因素P小于显著性系数0.05就拒绝原假设,反之,不拒绝原假设。

16、第二部分一获得数据:进入国家统计局网站。点击统计数据,数据年鉴,年份总计年底余额定期活期1978210.6128.981.71980395.8304.990.919851622.61225.2397.419907119.65909.41210.219919244.97634.91610.0199211757.39445.02312.3199315203.512108.33095.2199421518.816838.74680.1199529662.323778.35884.1199638520.830873.27647.6199746279.836226.710053.1199853407.5

17、41791.611615.9199959621.844955.114666.7200064332.446141.718190.7200173762.451434.922327.6200286910.758788.928121.72003103617.768498.735119.02004119555.478138.941416.52005141051.092263.548787.52006161587.3103011.458575.92007172534.2104934.567599.72008217885.4139300.278585.22009260771.7160230.4100541.

18、32010303302.5178413.9124888.6点击链接EXCE而进入软件,完成数据的获得。200173762.451434.922327.6200286910.758788.928121.72003103617.768498.735119.02004119555.478138.941416.52005141051.092263.548787.52006161587.3103011.458575.92007172534.2104934.567599.72008217885.4139300.278585.22009260771.7160230.4100541.32010303302.5

19、178413.9124888.6筛选取得2001年到2010年的数据。二.描述数据图表。使用折线图来描述年底余额总计的变化。完成从 2001 到 2010 年的收入余额的变化趋势。从 2001 年到 2010 年的收入余额平均数为平均数最大174135.1303303标准差75334最小值. 、 、/、 方差中位数峰度偏度求和观测数737622.44E+09174135.1-0.50.66093512.441E+09103构建函数表单:使用数据定期51434.958788.968498.778138.992263.5103011.4104934.5139300.2160230.4178413.

20、9Z值法抽样。年底余额定期 样本统计量样本个数10样本均值103501.5用户输入总体标准差71554置信水平0.95计算结果抽样标准差70554Z 值0.8224268置信区间半径58025.501置信区间下限12528.499置信区间上128579.5定期51434.958788.968498.778138.992263.5103011.4104934.5139300.2160230.4178413.9T值样本统计量样本个数样本均值样本标准差用户输入置信水平计算结果抽样标准差自由度T值置信区间半径置信区间下限置信区间上限10103501.5705540.9522311.192.262157

21、2159604.24-56102.74116102.74定期51434.958788.968498.778138.9 92263.5103011.4104934.5139300.2160230.4178413.9样本统计量样本个数样本方差用户输入置信水平计算结果自由度a/2卡方值1-a/2卡方值置信区间下限置信区间上限1018687525000.95919.02276782.700389522-56102.7361116102.7361使用数据定期活期51434.922327.658788.928121.768498.735119.078138.941416.592263.5103011.41

22、04934.5139300.2160230.4178413.9定期为样本1样本统计量样本1个数样本2个数样本1方差样本2方差用户输入置信水平计算结果第一自由度第二自由度a/2 F 值1-a/2 F 值置信区间下限置信区间上限48787.558575.967599.778585.2100541.3124888.6活期为样本21010186875250010868147310.95994.0259941580.2483858550.4270936656.922602755抽样结果定期 活期假设检验总体方差已知,总体均值检验H0H1样本统计量样本均值用户输入总体标准差总体均值假设值置信水平计算结果抽

23、样平均误差检验统计量检验区间下限检验区间上限检验结果总体均值=总体均值假设值总体均值?总体均值假设值1498334.840905.25900000.9510932.390.762395-1.959961.959964不拒绝H0200478138.941416.5200592263.548787.52006103011.458575.92007104934.567599.72008139300.278585.22009160230.4100541.32010178413.9124888.6分差分析单因素方差分析数据如下活期200478138.941416.5200592263.548787.52

24、006103011.458575.92007104934.567599.72008139300.278585.22009160230.4100541.32010178413.9124888.6方差分析:单因素方差分析SUMMARY组观测数求和平均、.、.广. 力左四7 856292.7122327.51.4E+09活期7 520394.774342.18.82E+08方差分 析SSdfMSFP-valueF crit组问8.06E+0918.06E+097.0626730.0208854.747225组内1.37E+10121.14E+09总计2.18E+1013分差分析可重复双因素分析方差分

25、析:可重复双因素分析SUMMARY200578138.8641416.53总计观测数336求和300209.174963.475172.415平均100069.58321.079195.4841、.、.广. 力左466277088524285.77E+04882008观测数336求和477944.304015.781959.415平均159314.101338.130326.846、.、.广. 力左3.83E+05.36E+01.38E+0889总计观测数66求和778153.478978.82平均129692.379829.7、.、.广. 力左1.22E+08.05E+098方差分 析SSd

26、fMSFP-valueF crit样本7.84E+0917.84E+0929.744832020.0006065.317655列7.46E+0917.46E+0928.287199860.0007125.317655交互1.98E+0811.98E+080.7490212850.4119875.317655内部2.11E+0982.64E+08总计1.76E+1011方差分析:无重复双因素分析SUMMARY观测数求和平均、.、.r.万差20052141050.9970525.59.45E+0820062161587.380793.659.87E+0820072172534.1986267.16.97E+0820082217885.35108942.71.84E+0920092260771.66130385.81.78E+0920102303302.5151651.31.43E+0978138.866778153.81129692.31.22E+0941416.536478978.1879829.78.05E+08方差分析差异源SSdfMSFP-valueF crit行9.92E+0951.98E+0943.622060.0003995.050329列7.46E+0917.46E+09163.95265.17E-056

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论