版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、生物统计学(Biosistics)第4讲(上)抽样分布及参数估计Ph.D /Prof.: 2017/9/28目录抽样误差概念抽样误差产生原因抽样误差规律性 标准误t 分布及其概率计算2017/9/28【实例一】 某医师将20名失眠患者随机等分为两组,一组服用,另一组服用安慰剂,者要评价某的效果,治疗失眠前后的睡眠时间及其差值结果见表10.1,试作统计分析。2017/9/282017/9/28抽样分布基本统计学原理统计学中有两种不同性质的分布;一种是用于描述,由于变异的存在,对应的观察值或变量所表现出来的分布,如前面给大家介绍的正态分布、二项分布、Poisson分布。另外还有另一种分布是统计量的
2、抽样分布,如t分布、u分布、F分布、2分布等。20010002017/9/28Xbar问题1何为t分布?1、抽样误差的概念:抽样误差:是指样本与总体之间或同一总体当中样本与样本之间的差异,称为抽样误差。X 117.5X 109某地小学六年级学生智商平均水平 1102017/9/282、抽样误差的产生的原因:变异抽样本身动物为对象:差异小,抽样误差小,因此所需要样本小为对象:差异大,抽样误差大,因此所需要样本大都或多或少地叠加了测量误差(系统误差和随机误差)同品系动物,同质性好同卵双生和异卵双生动物组织细胞同株细胞细胞器2017/9/28科学性差异显示了的反应性不同细说误差差异和误差区别抽样误差
3、主要是指差异来源宏观层次误差样本层面误差统计学上分离信号可能受到差异和测偏倚量误差的影响,两种差异叠加为抽样误差随机抽样误差1、如果没有差异,准确度和精密度仅存在测量误差,假设检验作用仅是滤过测量误差的影响,此时效应就是完全一样;2、如果没有测效度和信度抽样无知者无畏量误差,仅存在 假设检验仅是滤过异引起的抽样误差效应也存在理更远微观层次误差层面误差2017/差异,差偏见比无知离真。此时测量误差差异。差异随机误差系统误差9/28真实性3、抽样误差的具有规律性: 若原变量X服从正态分布N( ,2),随机抽取样本含量为n的样本均数也服从正态分布;即使从偏态总体中随机抽样,当n足够大(如n30)总体
4、100个样本随机抽样2)N(,2017/9/28Populationx4.58Sample4.094.884.204.544.275.364.814.354.504.675.334.314.134.685.104.183.845.264.926.185.624.123.944.485.784.334.175.044.134.374.635.334.414.405.124.844.855.385.055.405.184.405.264.763.604.743.294.935.144.274.794.664.814.014.604.915.415.055.073.925.294.574.754.7
5、64.454.525.174.713.605.465.234.975.804.584.433.864.554.123.314.815.583.946.014.344.994.995.424.795.325.093.535.485.504.724.494.245.704.894.254.214.154.08.4.67.e ( X )2 2 2 1f ( X ) 2 N (,2 )X2017/9/285.07 5.21 3.733.07 5.03 4.535.10 4.33 3.334.09 5.33 4.33若从正态总体 N(, 2 )中,反复多次随机抽取样本含量固定为n的样本,那么这些样本均数
6、 X 也服从正态分布,即X 的总体均数仍为 ,样本均数的标准差为 /n抽样分布2017/9/28抽样分布示意图中心极限定理抽样分布观察值分布抽样分布示意图2017/9/28时,样本均数也近似服从正态分布。 从均数为,标准差为的正态或偏态总体中,抽取例数为n的多个样本,则各样本的均数的总体均数也为,样本均数的标准差则比原值的标准 x差要小,为区别两者,样本均数的标准差用示。表2001000N (, x )Xbar2017/9/28BA2017/9/28CD2017/9/282017/9/284、标准误衡量抽样误差大小的指标标准误是衡量抽样误差大小,它的实质就是样 x本均数的标准差用表示,更确切地
7、讲是样本统计量的标准差。它的大小由如下公式确定: xn在实际工作中,总体标准差往往是未知的,而用样本标准差s来估计,因此均数标准误的估计值为:ssxn2017/9/28标准误和标准差的区别 x标准差 x标准误意义描述值间的变描述统计量的抽样误差,即描述统计量与总体参数的接近程度异,即观察值的离散度观察值间的波动大小,如精密度大小,当资料服从正态分 布,可结合均数估 计正常值范围标准差随着样本含量的增多,逐渐趋于稳定表示抽样误差大小,用途估计参数的区间标准误随着样本含量的增多逐渐减少,若样本含量趋近于总体例数时,标准误趋近于0,几乎与样本含量的关系2017/9/28标准误和标准差的联系:标准差与
8、标准误都是变异指标,说明值之间的变异用标准差,说明统计量之间的变异(即抽样误差)用标准误,故亦将标准误称为统计量的标准差。当样本含量不变时,标准差越大,标准误亦越大,如均数的标准误与标准差正比。ssxn2017/9/28Xx标准误的应用:表示抽样误差的大小,用来衡量样本均数的可靠性,标准误越小,样本均数与总体均数之间的误差越小,说明样本均数越接近总体均数,因此用样本均数来估计总体均数越可靠,反之亦然。结合样本均数可用于估计总体均数的区间。可用于均数的假设检验。样本统计量所对应的标准差,统计学上地称为标准误,标准误反映抽样误差的大小,即反映总体特征被估计的精确程度。2017/9/28身高(x)x
9、身高均数X2X1X抽样Xxx6x1xx52 4 XX74 x8x63x7XX835 nxxx个体观察值分布x x u u x抽样分布u2017/9N/28(0,1)uN(0,1)xN (, 2 )xxN (, 2 )x5、t分布的导出W.S.Gosset于1908年提出样本均数的分布是什么分布?100个样本总体随机抽样n=302017/9/28N (0,1)x nz N (, x)25.32N (155.4,)2017/9/2830 X N (, 2 )xxnz变换变成标准正态分布往往未知,这时可用样本标准差s代替x z ssxnxz xsx这就是t分布2017/9/28 tsnN (0,1)
10、x nz x x N (, 2 )t xss5.32xnN (155.4,)2017/9/2830计学家W.S.Gosset于1908年以“Student”笔名英,证明了统计量t服从=n1的t分布。即:x x t =n 1t分布,ssxnt分布(Students又称为studentt-distribution)2017/9/28t分布是一种抽样分布f (t )v v 5v 1标准正态分布图4-2不同度的 t 分布图2017/9/28200200t分布均数分布100100标准化Std. Dev = 1.02Std. MeanN =Mean = -.03N= 1000.0000ut200均数分布1
11、00Std. Dev =2.43Mean = 155.33N = 1000.0002017/9/28XBARt分布具有如特征:t分布为一簇单峰分布曲线。t分布以0为中心,左右对称。(3)t分布与度V有关,度越小,t分布的峰越低,而两侧尾部翘得越高;度逐渐增大时,t分布逐渐逼近标准正态分布;当正态分布。度为无穷大时,t分布就是标准每一度下的t分布曲线都有其自布规律,这个规律可见于t界值表,表中横标目为度,纵标目为概率P,表中数据为相应的t界值,常记为t、(单尾)或t/2、值(双侧)。2017/9/28正如正态分布一样,t分布亦有面积分布规律-t0t附表2t 界值表概率,P度0.250.200.1
12、00.050.0250.010.0050.00250.0010.0005单侧2017/不9/2同8度下t界值对应的概率有差异双侧0.500.400.200.100.050.020.010.0050.0020.0011234567891021222324251.0001.3763.0786.31412.70631.82163.657127.321318.309636.6190.8161.0611.8862.9204.3036.9659.92514.08922.32731.5990.7650.9781.6382.3533.1824.5415.8417.45310.21512.9240.7410.9
13、411.5332.1322.7763.7474.6045.5987.1738.6100.7270.9201.4762.0152.5713.3654.0324.7735.8936.8690.7180.9061.4401.9432.4473.1433.7074.3175.2085.9590.7110.8961.4151.8952.3652.9983.4994.0294.7855.4080.7060.8891.3971.8602.3062.8963.3553.8334.5015.0410.7030.8831.3831.8332.2622.8213.2503.6904.2974.7810.7000.8
14、791.3721.8122.2282.7643.1693.5814.1444.5870.6860.8591.3231.7212.0802.5182.8313.1353.5273.8190.6860.8581.3211.7172.0742.5082.8193.1193.5053.7920.6850.8581.3191.7142.0692.5002.8073.1043.4853.7680.6850.8571.3181.7112.4922.7973.0913.4673.7450.6840.8561.3161.7082.0602.4852.7873.0783.4503.725t 统计量的分布设2,Xn
15、1是来自正态总体N(1,2)的一个1样本, 称t ( X )为统计量,它服从度为(n-1)的t 分布s nt 分布标准正态分布t (df = 13)t (df = 5)正态分布ZtX不同度的t分布t 分布与正态分布的比较2017/9/28t分布(Studentst-distribution)的数理定义:-tt0t分布的概率密度函数2正017态/9分/2布8t分布曲线下面积分布规律:f(t) =(标准正态曲线) =5 =10.3面积即表示概率0.20.1-4-3-2-101234图3.22017/9/28度分别为1、5、时的t分布当度无穷大时,t分布接近标准正态分布:f(t)t0.05/ 2,
16、u0.05/ 2 1.96 2.58 =5 =1 ut0.30.01/ 2,0.01/ 2面积即表示概率0.2x sxx t s0.1n-4-3-2-101234( X ) Z分布 /图3.2度分别为1、5、时的t分布2017/9/28n =(标准正态曲线)t分布t值与t分布的引入N(,2)观察值正态分布样本均数正态分布N(, 2 )Xu X Xt X Su X X u XXt分布N(0,1)标准正态分布0.0250.0251.9601.962017/9/28S代替SPSS中t分布函数或累积分布函数介绍CDF : cumulative distribution function2017/9/2
17、8CDF T ( tvalue , df ) .SPSS中t分布概率密度函数绍PDF : Probability distribution function2017/9/28CDF.T(quant, df).Numeric. Returns the cumulative probabilityt a value from Students t distribution, with the specified degrees of freedom df,will be lessn quant.2017/9/28CDFNORM ( tvalue , df ) .(1)若求P(Xk)或P(X k)时,其数学表达式:(2)若求P(Xk)或P(X k)时,其数学表达式:(3)若求P(k1Xk2)时,其数学表达式:2017/9/28P( k1 X k2 ) CDF.T( k2, df )- CDF.T( k1, df ).P( X k )1- CDF.T( k, df ).P( X k )CDF.T( k, df ).思考题?:当度为df为10时,求下列对应t值的概率:(1)求P(t-2.228)=?(2)求P(t2.228)?(3)求P(2.1t 2.3)?2017/9/282017/9/28以下分布也服从 t 分布 -X N ( ,2 )如果X (i=1,2,3,n
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 非拉国家的独立和振兴课件 华东师大版
- 旅行团自愿不买摆渡车的协议书
- 创意目录篇课件
- 《跟腱断裂护理查房》课件
- 电机与电力拖动课件-第6章
- 2024年度版权维权合同范本2篇
- 2025年贵州货运从业资格考试试题及答案大全解析
- 2024年度水稳材料采购与知识产权保护合同3篇
- 2025年阿坝道路运输从业人员资格考试内容有哪些
- 《工作流程集合》课件
- 信息检索智慧树知到期末考试答案章节答案2024年齐鲁工业大学
- 阿尔茨海默病的诊断和药物治疗方法
- 新建足球训练基地项目可行性研究报告
- 30题仪表工程师岗位常见面试问题含HR问题考察点及参考回答
- 少儿艺术培训公司简介
- 老旧小区改造项目经济效益和社会效益分析
- 【中考真题】2022年广东省深圳市中考数学试卷(附答案)
- 四年级语文上册第四单元作业设计案例
- MOOC 风景背后的地貌学-华中师范大学 中国大学慕课答案
- 《色彩构成》课件- 第六章 色彩的心理分析
- 全国职业院校技能大赛(酒水服务)考试题库(含答案)
评论
0/150
提交评论