统计推断PPT学习教案_第1页
统计推断PPT学习教案_第2页
统计推断PPT学习教案_第3页
统计推断PPT学习教案_第4页
统计推断PPT学习教案_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1统计推断统计推断1.无效(零)假设H0 ,备择假设 HA例如:21210:H:HA222122210:H:HA 试验研究目的不同、变量属性不同,统计假设检验的方法不同而公式不同。主要有t检验、F检验、x2检验等方法。第1页/共64页2. 统计假设检验的原理小机率原理小机率原理: 概率很小的事件,在一次试验中是不至于发生的。统计学中一般认为概率p0.05,才算小机率事件。3. 计算统计量 t、F、 x2等 在SAS中,直接算出t、F、 x2等统计量,及其Pr|t|或PrF或Pr x2的概率值。根据小机率原理做出统计推断。 第2页/共64页例若Pr|t|概率值:0.05,则接受H0零假设,

2、差异不显著。0.05,不能接受H0零假设,推断差异达显著。 0.01,更大把握拒绝零假设,推断差异极显著。4. 写统计推断5. 依题意写统计结论t分布图第3页/共64页一、单个样本均数的t检验二、两个样本均数的t检验统计原理实例及SAS程序三、实习第4页/共64页1/0ndfnSx:t公式目的:检验样本所属总体均数是否和某指定的总体均数相等00:H第5页/共64页例 某地杂交玉米在原种植规格下一般亩产350,现为了间套作,需改成一种新种植规格,新规格下8个小区产量分别为360、340、345、352、370、361、358、354(/亩)。问新规格与原规格下玉米产量差异是否显著?第一步H0:

3、=0=350 , HA: 0。491.18/4868.9350355/0第二步计算nSxt第三步t1.491 t0.05,72.365,p5%,故接受H0,差异不显著。第四步结论:认为改变种植规格后的玉米产量与原种植规格的玉米产量无显著差异。第6页/共64页例6.3 某地杂交玉米在原种植规格下一般亩产350,现为了间套作,需改成一种新种植规格,新规格下8个小区产量分别为360、340、345、352、370、361、358、354(/亩)。问新规格与原规格下玉米产量差异是否显著?单个样本均数的检验第7页/共64页单个样本均数的检验的SAS程序:data aa;input x ;y=x-350;

4、cards;360 340 345 352 370 361 358 354;proc means mean t prt; var y;run;第8页/共64页其输出结果:第四步结论:改变种植规格后的玉米产量与原种植规格的玉米产量无显著差异。MEANS 过程分析变量:y 均值t 值Pr |t|5.00000001.490.1797Prob|T|第9页/共64页data aa;input x ;cards;360 340 345 352 370 361 358 354;proc ttest h0=350;var x;run;SAS软件8、9版本的ttest过程中,不必先求差值即可对成对数据直接进行

5、检验。第10页/共64页The TTEST ProcedureStatisticsStatisticsVariablVariable eN NLower Lower CLCLMeanMeanUpper Upper CLCLLower Lower CLCLMeanMeanMeanMeanStd DevStd Devx x8 8347.07347.07355355362.93362.936.27246.2724VariablVariable eStdStdDevDevUpper Upper CLCLStdStdErrErrMinimumMinimum MaximumMaximumStd DevSt

6、d Devx x9.48689.486819.30819.3083.35413.3541340340370370第11页/共64页T-TestsVariableDFt ValuePr |t|x71.490.1797第四步结论:改变种植规格后的玉米产量与原种植规格的玉米产量无显著差异。第12页/共64页2.成组法T测验(group comparisons t test )1.成对法T测验(paired comparisons t test )统计原理实例及SAS程序统计原理实例及SAS程序第13页/共64页把条件一致的两个供试单元配成一对,设多个配对,每一配对两个单元随机独立实施一处理,这就是配

7、对试验,实为处理数为2的随机区组试验,这样得到的数据称为成对数据。o:doHiiixxd211/ndfnsdsdtdd第14页/共64页P62例6.5 为测定A、B两种病毒对烟草的致病力,取8株烟草,每一株半叶接种A,另半叶接种B,以叶面出现枯斑数的多少作为致病力强弱的指标,得结果于表4.4。试测验两种病毒致病力的差异显著性。两病毒在烟叶上产生的枯斑数 株号 1 2 3 4 5 6 7 8A病毒9 10 17 11 31 18 18 14B病毒7 6 8 7 20 17 20 5H0: 两种病毒致病力一样第15页/共64页 data b; input x1 x2; d=x1-x2; cards

8、; 9 10 17 11 31 18 18 14 7 6 8 7 20 17 10 5 ; proc means mean stderr t prt; var d; run;成对法T测验SAS程序:数据行输入错误 株号 1 2 3 4 5 6 7 8A病毒9 10 17 11 31 18 18 14B病毒7 6 8 7 20 17 20 5第16页/共64页 data b; input x1 x2; d=x1-x2; cards; 9 7 10 6 17 8 11 7 31 20 18 17 18 20 14 5 ;成对法T测验SAS程序:数据行输入正确 株号 1 2 3 4 5 6 7 8A

9、病毒9 10 17 11 31 18 18 14B病毒7 6 8 7 20 17 20 5proc means mean t prt; var y;run;第17页/共64页其输出结果: The SAS SystemAnalysis Variable : D Mean Std Error T Prob|T| - 4.75000 1.60078 2.97 0.0209 -结论:A、B两种病毒的致病力有显著差异。第18页/共64页SAS软件8、9版本的ttest过程,可对成对数据直接进行检验. data b; input x1 x2;cards; 9 7 10 6 17 8 11 7 31 20

10、18 17 18 20 14 5 ;proc ttest;paired x1*x2; run;第19页/共64页The TTEST ProcedureStatisticsStatisticsVariablVariable eN NLower Lower CLCLMeanMeanUpper Upper CLCLLower Lower CLCLMeanMeanMeanMeanStd DevStd Devx1-x28 80.96480.96484.754.758.53528.53522.99362.9936VariablVariable eStdStdDevDevUpper Upper CLCLSt

11、dStdErrErrMinimumMinimum MaximumMaximumStd DevStd Devx1-x24.52774.52779.21519.21511.60081.6008-2-21111第20页/共64页T-TestsDifferenceDFt ValuePr |t|x1 - x272.970.0209结论:A、B两种病毒的致病力有显著差异。第21页/共64页),(),(22212221ssMinssMaxF 22210:HProbF =若 0.05,差异不显著,接受2221若 0.05,差异显著,则2221样本方差同质性检验第22页/共64页)11(2) 1() 1(212

12、122221121nnnnsnsnxxt221nndf时当2221(1)第23页/共64页22212121nsnsxxt时当2221(2)1)/(1)/()/()/(22222121212222121nnsnnsnsnsdf第24页/共64页表3.2成组试验资料P60 例6.4:今有A、B两个橡胶有性系,均在同一环境、同一管理下生长,产量于下表,试测定其产量差异显著性。有性系有性系 产量产量 n nA69979211B3261 6117成组法实例第25页/共64页成组法T测验程序:data yild; input strain $ yield ; cards;a 69 a 97 a 106 a

13、 92b 32 b 61 b 50 b 46;proc ttest; class strain; var yield;run;第26页/共64页输出结果:结论:品系A、B的产量差异极显著。T-TestsVariableMethodVariancesDFtValuePr|t|yieldPooledEqual264.130.0003yieldSatterthwaiteUnequal18.13.930.0010EqualityofVariancesVariable MethodNumDFDenDFFValuePrFyieldFoldedF10161.560.4141第27页/共64页割制割制乙烯利乙

14、烯利x1x1电石电石x2x21 12 23 34 45 56 67 78 89 91010111173.273.259.959.939.139.116.716.7149.7149.7101.1101.170.570.535.035.084.884.867.467.450.350.376.076.056.056.038.338.319.319.3113.8113.874.074.054.954.912.412.476.976.968.868.837.137.1实习二实 习 三结果:乙烯利效果显著于电石第28页/共64页2. (作业5)用40乐果乳油500防治茶小绿叶蝉,喷药区十二个,对照区十个,

15、测得产量结果如下(单位:公斤):40乐果乳油500: 97.0 254.9 345.5 399.6 177.0 322.6 577.6 251.6 251.0 337.3 22.7 292.9 154.6对照喷清水: 42.6 157.6 65.3 162.1 93.5 215.2 226.6 109.9 106.7 40.5问喷洒此药有无防治和增产作用?结论:喷洒40乐果乳油的茶青产量极显著高于对照,该药对防治茶小绿叶蝉有效。第29页/共64页3. 有一水稻施肥试验,处理为A、B两种施肥方法,完全随机设计,试验结果见表3.1。试测验两种施肥方法水稻产量有无显著差异。表3.1 两种施肥方法水稻

16、小区产量()x1 (A)x2 (B)8.29.68.78.99.48.510.711.29.210.911.110.8第30页/共64页 data b; do trt=1 to 2; input x; output; end; cards;8.210.7 9.611.2 8.79.28.910.9 9.411.1 8.510.8; proc ttest; class trt; var x; run;成组法T测验程序:第31页/共64页4. 将14只大白鼠随机分为两组,一组做成白血病模型鼠,一组为正常鼠,两组鼠脾脏DNA含量(mg/g)如下,请分析两组鼠表脾脏DNA平均含量是否不同?白血病组(x

17、1):12.3 13.2 13.7 15.2 15.4 15.8 16.9 正常组(x2): 10.8 11.6 12.3 12.7 13.5 13.5 14.8第32页/共64页一、x2测验的基本公式:ttax22)(其中:a为实测值 t为相应的理论值K.Pearson(1900)根据x2定义,从属性性状的分布推导出用于计数资料分析的x2公式。第33页/共64页 当df=1的样本,必须用连续性矫正公式,否则x2偏大,容易达到显著水平。对df2的样本,不作矫正。ttaxc2212)|(|x2的矫正公式:第34页/共64页 判断两组或多组资料是否相互关联的问题,即独立性检验,亦称列联表分析。2.

18、 2C联列表的x2测验法 解决两处理多种结果(或多处理两种结果)的情况3. RC联列表的x2测验法 解决多种处理多种结果的情况第35页/共64页结果结果1结果结果2合计合计处理处理1处理处理2a11a12a21a22R1R2合计合计C1C2n2.矫正公式:1,)|(|212122211222112DFRRCCnaaaaxnC1.资料整理的一般形式:4.1 22联列表的x2测验法第36页/共64页1.资料整理的一般形式:4.3 RC 联列表的x2测验法横行因素横行因素 纵行因素纵行因素1 2 1 2 c c总计总计 12Ra11 a12 a1ca21 a22 a2c ar1 ar2 arcR1R

19、2Rr总计总计C C1 1 C C2 2 C Cc cn n2. 公式:) 1)(1( 1)(22crdfcranxjiij第37页/共64页data 数据集名; do a=1 to 行数; do b=1 to 列数; input x ; output; end; end; cards;数据;proc freq; weight x; tables a*b/chisq;run;实例:P64 P66第38页/共64页data rubber1; do a=1 to 2; do b=1 to 2; input x ; output; end; end; cards;97 403 160 340;pro

20、c freq; /*频数过程*/ weight x; tables a*b/chisq; /*a(行)b(列)联列表并输出x2值*/run;1. 22联列表的x2测验法例6.6:橡胶芽接位保护比较试验。P64 处理处理死亡株死亡株成活株成活株不切腹囊皮不切腹囊皮切腹囊皮切腹囊皮97403160340 试测验植株越冬后死亡率是否因切或不切腹囊皮而异?第39页/共64页FREQ过程过程频数频数百分比百分比行百分比行百分比列百分比列百分比97/1000a * b 表ab合计1 2 1 979.7019.4037.7440340.3080.6054.2450050.00 2 16016.0032.00

21、62.2634034.0068.0045.7650050.00 合计 25725.7074374.301000100.0097/50097/257SAS主要输出结果:第40页/共64页a * b 表的统计量表的统计量统计量统计量自由度自由度值值概率概率卡方卡方120.7854 .0001似然比卡方似然比卡方120.9504 .0001连续校正卡方连续校正卡方120.1308 .0001Mantel-Haenszel 卡方卡方120.7647 .0001Phi 系数系数-0.1442列联系数列联系数0.1427Cramer 的的 V -0.1442第41页/共64页a * b 表的统计量表的统计

22、量统计量统计量自由度自由度值值概率概率卡方卡方120.7854 .0001似然比卡方似然比卡方120.9504 .0001连续校正卡方连续校正卡方120.1308 .0001统计推断:因c2 =20.13, 其出现的概率p 0.01, 差异极显著。又因不切时样本死亡率为19.40% 切时的32.00%, 故不切腹囊皮胶树越冬后死亡百分率极显著低于切腹囊皮的死亡百分率。第42页/共64页SAS8.0输出结果: TABLE OF A BY B A B Frequency| Percent | Row Pct | Col Pct | 1| 2| Total -+-+-+ 1 | 97 | 403 |

23、 500 | 9.70 | 40.30 | 50.00 | 19.40 | 80.60 | | 37.74 | 54.24 | -+-+-+ 2 | 160 | 340 | 500 | 16.00 | 34.00 | 50.00 | 32.00 | 68.00 | | 62.26 | 45.76 | -+-+-+ Total 257 743 1000 25.70 74.30 100.00第43页/共64页 STATISTICS FOR TABLE OF A BY B Statistic DF Value Prob - Chi-Square 1 20.785 0.000 Likelihood R

24、atio Chi-Square 1 20.950 0.000 Continuity Adj. Chi-Square 1 20.131 0.000 Mantel-Haenszel Chi-Square 1 20.765 0.000 Fishers Exact Test (Left) 3.35E-06 (Right) 1.000 (2-Tail) 6.70E-06 Phi Coefficient -0.144 Contingency Coefficient 0.143 Cramers V -0.144 Sample Size = 1000第44页/共64页Tables语句中有四个选项用来取消四个统

25、计量的打印。Nofreq 取消打印单元频数Nopercent 取消打印单元百分数Norow 取消打印行百分数Nocol 取消打印列百分数例1:橡胶芽接位保护比较试验。处理处理死亡株死亡株成活株成活株不切腹囊皮不切腹囊皮切腹囊皮切腹囊皮97403160340补充:第45页/共64页data rubber1; do a=1 to 2; do b=1 to 2; input x ; output; end; end;cards;97 403 160 340;proc freq; weight x; tables a*b/chisq nopercent nocol;run;程序修改:第46页/共64页

26、主要输出结果: p 0.01, 差异极显著;又不切时样本死亡率为19.40% 切时的32.00%。结论:不切腹囊皮胶树越冬后死亡百分率极显著低于切腹囊皮的死亡百分率。FREQ过程过程频数频数行百分比行百分比a*b表表ab合计合计1219719.4040380.60500216032.0034068.00500合计合计2577431000连续校正卡方连续校正卡方120.1308 .0001第47页/共64页data aa; do a=1 to 2; do b=1 to 2; input x ; output; end; end; cards;32 18 30 8 ;思考题:有人调查肺癌病人和正常

27、人吸烟情况如下表,试测定肺癌与吸烟是否有关?proc freq; weight x; tables a*b/chisq nopercent nocol; run;调查总人数调查总人数 肺癌人数肺癌人数吸吸 烟烟不吸烟不吸烟32 1830 8 18 14 8 22第48页/共64页主要输出结果:FREQ过程过程频数频数行百分比行百分比a*b表表ab合计合计1211856.251443.75322826.672273.3330合计合计263662统计量统计量自由度自由度值值概率概率卡方卡方15.56520.0183连续校正卡方连续校正卡方14.41660.0356统计结论:xc2 =4.4166

28、,p=0.0356 不吸烟26.67%, 故吸烟得癌症率显著高于不吸烟者。第49页/共64页2. 2c联列表的x2独立性测验法四、 x2 独立性测验的实例P66例6.7 调查橡胶两品系各级寒害株数资料如下: 级别品系 0 1 2 3 4 5AB 17 11 10 11 5 1 20 10 11 8 8 2试测验两品系的寒害程度差异显著性。第50页/共64页data rubber3; do a=1 to 2; do b=1 to 6; input x ; output;end;end;cards;17 11 10 11 5 120 10 11 8 8 2;proc freq;weight x;

29、tables a*b/chisq;run;a*b表的统计量表的统计量 统计量统计量自由自由度度值值概率概率卡方卡方51.69950.8890似然比卡方似然比卡方51.71250.8873Mantel-Haenszel卡方卡方10.02340.8784Phi系数系数0.1221列联系数列联系数0.1212Cramer的的V0.1221样本大小样本大小=114SAS输出:结论:因x2=1.6995 ,p=0.8890.05, 即、两品系寒害程度差异不显著.第51页/共64页(p66)例6.8 为研究人的血型与胃病的关系,对胃溃疡、胃癌患者与无病对照作血型调查结果如下:血型血型胃溃疡胃溃疡 胃癌胃癌

30、 无病对照无病对照OAB983 383 2892 679 416 2625134 84 570试作胃病与血型间的独立性测验。统计结论:因2=40.543,p 0.01, 差异极显著, 即胃病与血型间有极显著的关联。SAS程序略,其主要输出结果:统计量统计量自由度自由度值值概率概率卡方卡方440.54340.05, 差异不显著, 故叶子的情况与水深无关。 实 习 第53页/共64页第54页/共64页1. 基本原理与公式 H0:变量服从正态分布Shapiro-Wilk检验统计量W22)1()(/)(XXXXaWiiixi W值介于01之间。若prw的概率值大于0.05,则接受假设H0,认为资料服从正态分布;若prw的概率值小于0.05,则认为资料不服从正态分布。第55页/共64页 一般用UNIVARIATE过程来检验一个变量是否服从正态分布:PROC UNIVARIATE NORMAL DATA=数据集名;VAR 要分析的变量名;2. SAS分析第56页/共64页以下表为140行水稻试验的产量,试编一SAS程序,判断水稻

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论