统计学考试复习112总结_第1页
统计学考试复习112总结_第2页
统计学考试复习112总结_第3页
统计学考试复习112总结_第4页
统计学考试复习112总结_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(population(1)有限总体(finitepopulation(2)无限总体(infinitepopulation):很多为无限总体。(sample变异(variation,variablility)过差(mistakenerror):过失所致的误差(不认真,错误判断,记录等原因系统误差(systematicerror):仪器未校准所致的误差(统一偏高,或偏低随机测量误差(randommeasurementerror):不同观察者或同一观察者多次观察值的抽样误差(samplingerror):总体中存在变异,抽样研究中所抽取的样本,只包小概率定理测量的结果称为变量值(valueofvariable)或观察值(observedvalue,随机化单纯随机抽样(simplerandomsampling):总体全部观察单位编号,再用随机数字法或systematicsamplingnkstratifiedsampling:先按某种特征将总体分为若干组别、类型、区域,再第二章统计资料的收集和整理计量资料(measurement常用:平均数,标准差,t计数资料(enumeration(ranked实验设计(experimentdesign)、随机、重复(即样本例数)的原则。频数分布表(frequencydistributiontable)集中趋势(centraltendency):离散趋势(tendencyofdispersion):数值之间参差不齐;逐渐变大(或变小)的central1、算术平均数(arithmeticµxXa(a2geometricmean将n个观察值的乘积再开n次方的(或各观察值对数值均值的数。3、中位数(median,M)(2)(3)5、百分位数(percentile,P数值,就是百分位数,Pr表示。百分位数将总体或样本的全部观察值分为两部分,理论上有rtendencyof2、四分位数间距(quartile P75P25意义:QQ3、方差(variance)和标准差(standarddeviation1.961.645(95%)正态分布(normaldistribution)N(µσ)表示,其位置与均数有关,形状与标准差有关。u变换后,μ=0,σ=1,使原来的正态分布变换为标准正态分布(standardnormaldistribution)uxxx=μ正态分布有两个参数:均数,标准差;标准正态的参数分别为:0,1步骤:1234、选定合适的百分界限5、资料正态性检验6、进行参考值估计tsamplingerrorof用样本均数的标准差来估计,称标准误(standarderror)。即总体标准差和样本例数 是方差的平说明一组数据在其X周围的分散X

S反映用样本均数代表总体均数的可靠2t二、t分布(t-distribution)t5%tt0.05/2(υ),把两侧1%tt0.01/2(υ)。95%tt0.05/2(υ99%tt0.01/2(υt0.01/2(υ)。tPtPt穷大时,tuut点估计(pointestimation):用样本统计量作为对总体参数的估计值(μ)。比如μ<b)a,b(可信限。置信度(confidencelevel):α1-α,即为置信度.常用:95%,99%.置信区间(confidenceinterval,CI)t595%正常值范围一般是指同质总体内包括95%值的估计范围,X1.96S95%95%置信度估计的总体参数的可能范围,X1.96SX。ut-检验备择假设(alternativehypothesis),H1H1H0确定检验水准(sizeofatest):level:是H0的区间。μμ0,称双侧检验;若认为μ大于、等于不可能小于μ0(或相反,为单侧检验。必须事先根据专业知识予以确定,不能等到计算完t值以后再选定双侧检验是正确errorerror,用即无效假设(H0:u=u0)是正确的,但被,误为有差别(弃真错误统计学上定P≤0.055%假错误(falsenegativeerror),统计学上称为第二类错误(typeIIerror)。即无效假设(H0:u=u0)H1:u≠u0,tt0.05(取伪错误类错误:虽然无效假设为假,但由于抽到了较小(检验统计量)PP值越小说明无效假设越不可靠。或者说,P值越小就越有理由无效假设。P来判断的。ut第六章方差分析(一 2、分离各有关因素并估计其对总变异的作用3、分析因素间称为均方差,简称均方(meansquare,MS)。MSlvariation组间变异(betweengroupvariation:各组的均数Xi与总均数间的差异 n(xi-x)2,v=k-1xi)2,v=k(n-1) FF0.05(1,2),H0MSMS小,F1。Dunnett-tBartlett此外,Levene平转x´= x10x´=x1x´=x平反正弦转x´=arcsinx´=lgxx´=lg(x+1)(x0)一、22(factorialexperiment)设计第七章直线回归与相关依存关系:应变量(dependentvariable)Y随自变量(independentvariable)X变化而变化。——回归分析互依关系:应变量Y与自变量X间的彼此关系 ———相关分析第一节直线回归(linearregression线性回归)的直线方程称为直线回归方程(linearregressionequation)。自变量x:正态总体中的随量或指定变量 因变量y:服从正态分布的随机各实际值Y与估计值 abyY轴交点的纵坐标(X=0)x(减)一个单位,y平均变动b个单位b>0,YX的增大而增大()b<0,YX的增大而减小() ——水平最小二乘法原则(leastsquaremethod):使各实际散点(Y)到直线(Yˆ)总情况(总情况(YY(YY

ˆ) F =MS;=1,=n SS MSSS总=(YY)2Y的离均差平方和(totalsumofX与Y的回归关系时Y

nX对Y的线性影响之外的一切因素对YX解释的部分。SS剩

nX与Y的直线关系而使Y变异减小的部分,即总变异中,X解释的部分。SS回

|b-0 t=————=—— =n-S SSSb=——— SbSyxtb与trb

S(x-x)Y Yb(xx)Yi值的范围预测linearcorrelation简单相关(simplecorrelationx、y都是正态分布资料的随量(correlationcoefficientr 表示方法:-1 r直线回归:自变量是正态总体的随量或指定变量,y一定是正态总体的随量;rbrbtrtb Spearman秩相关适用资料:⑴从双变量正态分一、常用相对数(relativenumber)1、比(ratio)(rate121/万、1/10自然增长率=粗出生率-粗粗率(总率)mortality(incidencerate)患病率(prevalencerate)某病患病率=(检查时发现的某病现患病例数/该时点受检人口数)K某病率=(观察期间内因某病人数/同期某病总数)(1(1p pp(1pnup p up p sp(1pn总体率的假设检验(u当比较两个总率时,如果两组内部某种能影响指标水平的重要特征的构成上有差别,往往造成总率的升高或下降,影响两个总率的对比;因此要设法消除其内部构成的差异,使之能合理地进行比较,所用的方法称为标准化法。标准化法即在一个指1、直接法:以标准人口构成与实际的组别率求得一个调整率第九章卡方检验(一)2(AT)T:

=(R-1)(C-2(adbc)2(ab)(cd)(ac)(bd(21)(2连续性较正22(AT0.5)T( bcn/2)2.(ab)(cd)(ac)(bd2b b(whenbc2(bc)2(whenbcb22(adbc)2(ab)(cd)(ac)(bd(21)(2rn<40,T<1pp(ab)!(cd)!(ac)!(bda!b!c!dx2检验R>2or计算:2n(A2nRn(R1)(Crr R*C4/5>5;1/5x2检验的结果接受H1比较的次数比较的次数(1' ' k(k-1)/22实验组与'PearsonKappa或等级相关分析(spearman)Pearson-Man-Haenszel分层分析,按资料多来源(多中心,多地区,,等分层校正2r:2r2r第十章二项分布与普哇松分布2、各是相互排斥的,适于非遗传,非传染性疾病testπ2n<50npn(1-p)均<53、研究性各户居民家属中实际病例数X的分布与按二项分布求得的理当总体比例πn(n>100,每次出现概率<0.01)Poissionπ不接近0和n>100,butπ不接近0和n>100,butPoission4PoissionPoission4002x≥50(1.96,2.58)1、(1)μ较小时,Poission;2、两样本计数(不同情况采用不同第十一章非参数检验收料方便:可使用“等级“符号”等评定结H-(1(2)H适用:等级资料(两组或多组H-test(1)(2)用秩次代替原变量进行参数检验(LSD)RiditR-.单向有序数据:单向有序数据:适宜秩和检验Ridit优点:RiditX2-test标准组的平均R值总是等于0.5,对比组R 0—1之间。95%可信区间—不含()0.5,差异有意—含 )0.5,差异无意R0.5,表示其疗效差于标准组。近似实际情况得出的"差异无意义"的结论因此当可信区间刚好触及RiditRidit(取合并组作标准组)适用条件:相互比较的各组样本中无例数较多者(即无标准组)。(近似法-RR(u-R(x^2-test5-104 VariablesEntered/Removed(b)进入模型的变量及方法ModelSummary模型的 :决定系数R2 R—multiplecorrelationyx(多因素)间的总相关程度。RANOVA(b)Coefficients(a)R2最大的为最优方程。R2--R2。Coefficient CollinearityDiagnostics(a) 共线性诊断(Eigenvalue、ConditionIndex) *度 *条件指数ConditionIndexHistogram:残差应正态:基本呈高两头低P-PSR 流行病学研究方法studystudy:①病例对照研究--回顾性(retrospective)研究:从疾病(果)去寻找原因(病②队列(定群)研究--前瞻性(prospective)研究:从有无可疑原因(病因study它是将特定人群按照是否于某因素或程度分成组与非(,实验流行病学(experimentalepidemiology)--主要在人群现场进行。分为:临床试验(clinicaltrial)和人群现场试验(communityfieldtrial理论流行病学(theoreticalepidemiology)--数理流行病学(mathematical分别从病例及对照者中获得一个随机样本,并分这两组人于可疑病因的情况病例对照研究的四大要素:人群、对照、病例和传统四格表 :((aE(a)2 M-H

V2传统

比数比OR(oddsratio)--相对度RR的估计值,指病例组人数与非人数的 人数的比值。OR= OR的95%可信范围包含1: 1:1OR=c/b(一)累积(cumulative 累积的作用表示的累积影响累积的适用条件:样本量大。人口稳定,资料比较整齐。发病密度(incidence适用条件样本量小,或率低标化比最常用的指标为标化比(standardized相 度或率定义相对度(relativerisk,RR)或率比(rateratio)是指计算RR=1--表明与疾病无联系 归因度(attributablerisk,AR)或率差(ratedifference)是指组与非暴 AR=Ie-Io=a

c

AR的意义AR表示可使人群比未时增加的超额发病的数量,如果去除,则可使减少多少(AR的值),因此AR在疾病预防中很有意义。AR%>75%时,即可认为找到了主要病因。PAR表示在全人群中由于而导致的增加 It:全人病PAR%表示全人群中 It

It

分析方法:包括表(Lifetable)——用于描述

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论