版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
参数估计基础统计学:统计分析:
统计描述(statisticaldescription)
统计推断(statisticalinference):
参数估计(estimationofparameter)
假设检验(hypothesistest)统计描述:选用恰当的统计量、合适的统计表与统计图,测定、描述资料的数量特征及其分布规律。统计推断:在一定的可信程度下,由样本信息推断总体特征。参数估计:由样本统计量(statistic)估计总体参数(parameter)。假设检验:由样本差异推断总体之间是否可能存在差异。第一章绪论第二章定量变量的统计描述第三章定性变量的统计描述第四章常用概率分布第五章参数估计基础第六章假设检验基础已经学习了描述性统计,实际研究中,统计推断更有价值。总体往往是无穷大的抽象概念,个体之间存在差异,以样本为基础,进行关于总体特征或参数的推断或估计。美国专栏作家AnnLanders问她的读者:“如果可以重新选择,你还要孩子吗?”,她收到了近1万份读者来信。于是,Landers在她的专栏中写下了“将近70%的父母后悔要孩子”的标题。Newsday针对同样的问题开展了全美范围的专业调查,获得了一份包含1373对父母的随机样本,发现,91%的父母对当初的选择无怨无悔。美国的父母们对孩子的态度究竟是什么?
只要样本能够代表全美54917000个家庭这个总体,就可以用样本的“事实”估计总体的真实信息。Landers获得的只是一份自发性回应的便利样本,有高度偏差(对某个议题有强烈感觉尤其是有负面感觉的人更容易不厌其烦地回应),导致她的样本中宁愿不要孩子的百分比远高于全体父母(总体)中宁愿不要孩子的百分比。Newsday的简单随机样本(SRS,simplerandomsample):既不受抽样者偏好左右,也没有回应者的自行加入,且每个家庭都有相同的中选机会。虽然重新抽取一份1373对父母的随机样本,几乎可以肯定不会再获得91%,但如果重复抽取同样大小的随机样本,所有样本的变异将会遵循某种规律,借此,可以实现对总体的无偏估计。第一节抽样分布与抽样误差
由于个体变异的存在,从某一总体中随机抽取一个样本,所得样本统计量与相应的总体参数之间的差异称为抽样误差(samplingerror)。从同一总体中随机抽取若干份样本,所得样本统计量之间也不尽相同,这也是抽样误差的表现。在医学抽样研究中,抽样误差是不可避免的,但抽样误差是有规律的,而且是可以被认识的。一、样本均数的抽样分布与抽样误差
实验5-1正态分布总体样本均数抽样分布假定某年某地所有13岁女生的身高服从。计算机模拟在该总体中随机抽样,共抽100次。每次抽取30例组成一份样本,计算每份样本的平均身高(表5-1第(2)列)。样本均数的频率分布表(表5-2)。表5-1从正态总体抽出的100份随机样本的计算结果见P85表5-1表5-2从正态总体中随机抽样求得的100个样本均数(平均身高cm)的频率分布见P87表5-2正态分布总体,样本均数抽样分布的特点:①样本均数恰好等于总体均数是极其罕见的;②样本均数之间存在差异;③样本均数围绕总体均数,中间多、两边少,左右基本对称,呈近似正态分布;④样本均数之间的变异(见表5-1第(3)列)明显小于原始变量值之间的变异(cm)。样本均数的标准差,称均数的标准误(standarderrorofmean,SEM或SE),用于反映均数抽样误差的大小。均数标准误的估计值:均数标准误与原变量的标准差成正比,与样本含量的平方根成反比。可通过增加样本含量来减小均数的标准误,从而降低抽样误差。实验5-2非正态总体样本均数抽样分布图5-1(a):总体的原始数据呈正偏峰分布,从中抽取n
=5,10,30和50的样本各1000份,计算其样本均数并绘制相应的频率分布图(见P88)。图5-1(b)~(e)显示:当n较小时,样本均数的分布呈非正态分布,当样本含量足够大时(如),样本均数的分布就近似服从正态分布了。对任意分布,在样本含量足够大时,其样本均数的分布近似于正态分布,且样本均数的均数等于原分布的均数,均数的标准误为。图5-2
非正态总体,总体A:均匀分布;总体B:双峰分布;总体C:指数分布;总体D:三角分布。从各总体中抽取若干个样本含量为n=2,5,30的样本,计算每个样本的均数,则相应的样本均数分布见图5-2第2、3、4行。箭头所指为分布均数所在位置,说明均数的抽样分布的均数与原分布均数是相同的,抽样分布的变异随样本含量的增加而减少。二、样本频率的抽样分布与抽样误差
实验5-3二项分布总体样本频率的分布特征摸球实验:一个口袋内装有形状、重量完全相同的黑球和白球,已知黑球的比例为20%(总体概率)。从口袋中每摸一次看清颜色后放回去,搅匀后再摸,重复摸球50次(),计算摸到黑球的百分比(样本频率)。重复这样的实验100次,每次得到黑球的比例见表5-3。在100份样本中,黑球比例为20%的频率最大,其次是黑球比例为18%;样本频率围绕总体概率呈近似对称分布,多数样本频率离20%较近,少数样本频率离20%较远。与前述的样本均数的情形类似,这种样本频率与样本频率之间、样本频率与总体概率之间的差异也是由抽样造成的。若随机变量,则样本频率
的总体概率为,频率的标准误为:频率的标准误愈小,用样本频率估计总体概率的可靠性愈好;频率的标准误愈大,用样本频率估计总体概率的可靠性愈差。实际工作中,总体概率一般未知,常用样本频率来近似地代替,得到频率标准误的估计值:
频率的标准误与样本含量的平方根成反比,增加样本含量可以减少样本频率的抽样误差。例5-1某研究组随机调查了某市50岁以上的中老年妇女776人,其中患有骨质疏松症者322人,患病率为41.5%
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 沈从文《街》课件
- 银龙溪两岸护坡及堤顶道路工程施工组织设计方案
- 年产2000台玉米收获机技术改造项目可行性研究报告
- 法律保护我们的人格尊严课件
- 2015年重庆市B卷中考满分作文《我们携手走进友谊》
- 《条件随机场CRF》课件
- 《成长的烦恼》作文讲评课件
- 展览中心铝塑板安装施工协议
- 科技论文写作讲座课件
- 城市安全建设项目立项指南
- 大庆2024年黑龙江大庆市龙凤区人才引进80人笔试历年典型考题及考点附答案解析
- 烟酒行转让合同范本
- 案例2-5 节能效果对比讲解
- 2024年高考数学模拟试卷附答案解析
- 荆楚民艺智慧树知到期末考试答案章节答案2024年湖北第二师范学院
- 穿脱隔离衣的流程及注意事项
- 外国文学智慧树知到期末考试答案章节答案2024年九江职业大学
- 拼多多营销总结报告
- 电子信息类专业《计算机网络》课程教学的改革与实践
- 钢板加固梁施工方案
- 宴会设计与服务 课件 项目一、了解宴会文化
评论
0/150
提交评论