




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、药学统计学(2)1 第十章第十章 药学统计学药学统计学 药学导论药学导论 药学统计学(2)2 统计学(统计学(statisticsstatistics):研究数据的收集、描述、分析、):研究数据的收集、描述、分析、 综合和解释,以获得新信息、作出新推断的学科。综合和解释,以获得新信息、作出新推断的学科。 包括:包括: (1 1)制定调查方案和设计科学实验)制定调查方案和设计科学实验 (2 2)描述实验数据)描述实验数据 (3 3)进行假设检验)进行假设检验 (4 4)获知变量间的定量关系)获知变量间的定量关系 概概 述述 药学统计学(2)3 第一节第一节 几个基本统计学概念几个基本统计学概念
2、频率:频率: 概率:概率: () AA n i nf fA nf ( )( ) A n n n f AP A n 一、必然事件与随机事件一、必然事件与随机事件 必然事件:某条件实现后一定发生或一定不发生的事件必然事件:某条件实现后一定发生或一定不发生的事件 随机事件:一定条件下,不一定发生的事件随机事件:一定条件下,不一定发生的事件 二、频率与概率二、频率与概率 药学统计学(2)4 样本参数用英文字母表示样本参数用英文字母表示 总体参数用希腊字母表示总体参数用希腊字母表示 总 体 样 本 取样 观测 数 据 推 断 三、总体与样本三、总体与样本 药学统计学(2)5 随机性包括:随机性包括: 总
3、体中个体的抽取必须是相互独立的;总体中个体的抽取必须是相互独立的; 总体中所有个体被抽取的机会相等。总体中所有个体被抽取的机会相等。 满足以上两个要求的取样,称为简单随满足以上两个要求的取样,称为简单随 机取样(机取样(SRSSRS,simple random samplingsimple random sampling) 这样抽取的样本称为简单随机样本。这样抽取的样本称为简单随机样本。 药学统计学(2)6 四、观测值的特征四、观测值的特征集中位置与离散程度集中位置与离散程度 (1 1)均值)均值 样本均值样本均值 总体均值总体均值 E E(X X)取值取值概率概率 XXi iP Pi i 均
4、值的重要性质:均值的重要性质: 观测值与均值之差(偏差)之和观测值与均值之差(偏差)之和 偏差的平方和偏差的平方和 最小最小 1 1 n i i XX n i 0 ( X -X) i 2 ( X -X) 药学统计学(2)7 (2 2)众数)众数 频数最大的观测值叫众数,常用于表示离频数最大的观测值叫众数,常用于表示离 散型随机变量的集中位置。散型随机变量的集中位置。 (3 3)中位数)中位数 把变量的观测值按大小顺序排列,排在当把变量的观测值按大小顺序排列,排在当 中的一个观测值叫中位数。中的一个观测值叫中位数。 药学统计学(2)8 (1 1)极差)极差 (最大值和最小值之差)(最大值和最小值
5、之差) R RX Xmax max X Xmin min (2 2)平均(绝对)偏差)平均(绝对)偏差 1 1 | n i i dXX n (3 3)方差)方差 式中式中n n1 1在统计学中叫自由度(在统计学中叫自由度(degree of degree of freedomfreedom),常用希腊字母),常用希腊字母表示表示 2 2 1 () 1 n i i XX S n 药学统计学(2)9 五、两个典型的概率分布五、两个典型的概率分布 (1 1)特点:)特点: 二项分布是一种每次试验只有两种二项分布是一种每次试验只有两种 可能结果而不受以前实验影响的分布。可能结果而不受以前实验影响的分布
6、。 在样本容量相对于总体很小时,取样试在样本容量相对于总体很小时,取样试 验后,返回不返回,对下一次试验的结验后,返回不返回,对下一次试验的结 果无影响。果无影响。 药学统计学(2)10 (2 2)二项分布的均值、方差、标准差)二项分布的均值、方差、标准差 均值均值np np 方差方差npqnpq 标准差标准差 (3 3)二项分布的实际意义)二项分布的实际意义 一些只有两个结果的互斥事件都与二项分一些只有两个结果的互斥事件都与二项分 布有关,在药学方面,可用于分析从制剂批抽布有关,在药学方面,可用于分析从制剂批抽 出出n n个个体中不合格个体数的概率。个个体中不合格个体数的概率。 npq 药学
7、统计学(2)11 设连续性随机变量设连续性随机变量X X的概率密度为的概率密度为 则称则称X X服从参数为服从参数为 、 (- - + + , 0 0)的正态分布,记为)的正态分布,记为X XN N( , ) xxf x ,e 2 1 )( 2 2 2 1 药学统计学(2)12 (1 1)特点:)特点: 极大值在极大值在; 以以X X为对称轴;为对称轴; X X轴是渐进线;拐点在轴是渐进线;拐点在X X。 药学统计学(2)13 (2 2)标准正态分布)标准正态分布 一般的正态分布取决于均值一般的正态分布取决于均值 和标准差和标准差 计算概率时计算概率时 ,每一个正态分布都需要有自己,每一个正态
8、分布都需要有自己 的正态概率分布表,这种表格是无穷多的若能的正态概率分布表,这种表格是无穷多的若能 将一般的正态分布转化为标准正态分布,计算将一般的正态分布转化为标准正态分布,计算 概率时只需要查一张表概率时只需要查一张表 药学统计学(2)14 任何一个一般的正态分布,可通过下面的线性变换转任何一个一般的正态分布,可通过下面的线性变换转 化为标准正态分布化为标准正态分布 ) 1 , 0 ( N X Z 药学统计学(2)15 (3 3)标准正态分布表的使用)标准正态分布表的使用 将一个一般的转换为标准正态分布将一个一般的转换为标准正态分布计算概率时计算概率时 ,查标准正态概率,查标准正态概率 分
9、布表分布表 对于负的对于负的 x x ,可由,可由 (-x) (-x) x x 得到得到 对于标准正态分布,即对于标准正态分布,即XN(0,1)XN(0,1),有,有 P (aP (a X X b)b) b b a a P (|X| P (|X| a)a) 2 2 a a 1 1 对于一般正态分布,即对于一般正态分布,即XN(XN( , , ) ),有,有 ab bXaP)( 药学统计学(2)16 六、均值的分布和中心极限定理六、均值的分布和中心极限定理 如一个随机变量如一个随机变量X X呈总体均值为呈总体均值为、总体方差为、总体方差为22 的正态分布,则其容量为的正态分布,则其容量为n n的
10、样本均值的样本均值 也呈正态也呈正态 分布,其总体均值仍为分布,其总体均值仍为,但总体方差为,但总体方差为2 /n2 /n,即,即 X 2 2 X X n 药学统计学(2)17 设从均值为设从均值为 ,方差为,方差为 2 2的一个任意总体中抽取的一个任意总体中抽取 容量为容量为n n的样本,当的样本,当n n充分大时,样本均值的抽样分布充分大时,样本均值的抽样分布 近似服从均值为近似服从均值为、方差为、方差为2/n2/n的正态分布的正态分布 x x n 药学统计学(2)18 第二节第二节 取样取样 按与调查目的有关的某个主要性标志将总体单位划分按与调查目的有关的某个主要性标志将总体单位划分 为
11、若干层(也称类、组或子总体),然后从多层中按随机为若干层(也称类、组或子总体),然后从多层中按随机 原则分别抽取一定数目的单位构成样本。原则分别抽取一定数目的单位构成样本。 一、随机取样与随机数表一、随机取样与随机数表 简单随机抽样是最基本的抽样组织方式。是对总体单位简单随机抽样是最基本的抽样组织方式。是对总体单位 不进行任何划分或排队,完全随机地直接从总体中抽取样本不进行任何划分或排队,完全随机地直接从总体中抽取样本 单位,使每个总体单位都有完全均等的机会被抽中。单位,使每个总体单位都有完全均等的机会被抽中。 二、分层取样二、分层取样 药学统计学(2)19 在大规模生产中,表明供应方产品质量
12、特征的随在大规模生产中,表明供应方产品质量特征的随 机变量应不超出某规定范围。机变量应不超出某规定范围。 三、系统取样三、系统取样 常用于质量控制,每第常用于质量控制,每第n n个个体选取一个,但个个体选取一个,但 最初选取的个体是随机的。最初选取的个体是随机的。 四、验收取样四、验收取样 药学统计学(2)20 第三节第三节 数据制图数据制图 与统计方法有关的图解:与统计方法有关的图解: 以传递信息为目的的图解:以传递信息为目的的图解: 如直方图、条形图如直方图、条形图 在坐标中描述变量之间关系的图解在坐标中描述变量之间关系的图解 一、引言一、引言 药学统计学(2)21 在许多研究数据中,响应
13、在许多研究数据中,响应Y Y的对数而不是的对数而不是Y Y本身与本身与 独立变量独立变量X X呈线性关系,这样就要进行半对数标绘,即呈线性关系,这样就要进行半对数标绘,即 变量变量X X的坐标是自然数而响应(函数)的坐标是自然数而响应(函数)Y Y的是它的对数的是它的对数 logYlogY。 二、描述频数的图解二、描述频数的图解 直方图、条形图、扇形图直方图、条形图、扇形图 三、描述变量关系的标绘图三、描述变量关系的标绘图 药学统计学(2)22 第四节第四节 统计估计和假设检验统计估计和假设检验 统计方法统计方法 描述统计描述统计 推断统计推断统计 统计估计统计估计假设检验假设检验 药学统计学
14、(2)23 样本统计量均值样本统计量均值 和方差和方差S2S2分别是其总体均值分别是其总体均值 和总体方差和总体方差22的最佳估计。的最佳估计。 置信区间(置信区间(confidence intervalconfidence interval):是我们相信):是我们相信 统计量如总体均数所在的区间,由总体的性质、参数统计量如总体均数所在的区间,由总体的性质、参数 的样本估计值和想达到的置信度决定。的样本估计值和想达到的置信度决定。 以样本均值为对称中心的双侧置信区间:以样本均值为对称中心的双侧置信区间: P P置信区间置信区间 X n Z X 一、统计估计一、统计估计 药学统计学(2)24 P
15、 P置信区间置信区间 (1 1)未知,需要由样本估计未知,需要由样本估计 (2 2)已知,直接代入公式已知,直接代入公式 (3 3)比率的置信区间)比率的置信区间 t n S X 一、统计估计一、统计估计 药学统计学(2)25 二、假设检验二、假设检验 (1 1)概念)概念 事先对总体参数或分布形式作出某种假设事先对总体参数或分布形式作出某种假设 然后利用样本信息来判断原假设是否成立然后利用样本信息来判断原假设是否成立 (2 2)类型)类型 参数假设检验参数假设检验 非非参数假设检验参数假设检验 (3 3)特点)特点 采用逻辑上的反证法采用逻辑上的反证法 依据统计上的小概率原理依据统计上的小概
16、率原理 药学统计学(2)26 零假设(零假设(null hypothesisnull hypothesis):): 关于两个总体在某一参数如均值上一致(实关于两个总体在某一参数如均值上一致(实 际上差异为零)的假设际上差异为零)的假设H0H0。 如如 H0 H0:1122 备择假设(备择假设(alternative hypothesisalternative hypothesis):如):如 果舍弃果舍弃H0H0则接受则接受HaHa,HaHa也可用也可用H1H1表示。表示。 如如HaHa:1212 药学统计学(2)27 例:表 观测单一总体均值的实验示例 同类药物的治愈率新药的治愈率 值得临床
17、研究重视得血压降低标准值临床前研究中n只大鼠血压降低均值 药典片剂通则关于崩解时限的规定药片片剂平均崩解时限 标示量药片片剂的平均含量 假设值或标准值样本均值 对此例中每一类问题的假设检验,可提出三个假设检验:对此例中每一类问题的假设检验,可提出三个假设检验: H0:=0,Ha: 0H0:=0,Ha: 0 H0:=0,Ha: 0 H0:=0,Ha:0 H0:=0,Ha: 0 药学统计学(2)28 (1 1)提出检验统计量)提出检验统计量T T并进行实验并进行实验 (2 2)提出零假设)提出零假设H0H0和备择假设和备择假设HaHa (3 3)规定显著性水平)规定显著性水平 显著性水平:即根据统
18、计检验的结果舍弃零显著性水平:即根据统计检验的结果舍弃零 假设假设H0H0(存在显著差异)而实际上不存在的概率。(存在显著差异)而实际上不存在的概率。 (4 4)计算检验统计量)计算检验统计量T T并进行显著性检验并进行显著性检验 药学统计学(2)29 (1 1)已知的单样本双侧均值检验已知的单样本双侧均值检验 (2 2)已知的单样本单侧均值检验已知的单样本单侧均值检验 (3 3)未知的单样本双侧均值检验未知的单样本双侧均值检验 先求先求t t值,再计算置信区间,进行值,再计算置信区间,进行t t检验检验 (4 4)独立样本方差)独立样本方差S12S12和和S22S22的比较:的比较:F F检
19、验检验 00 | n n XX Z 2 药学统计学(2)30 从一组样本数据出发,确定变量之间的数学关系式从一组样本数据出发,确定变量之间的数学关系式 对这些关系式的可信程度进行各种统计检验,并从影响某对这些关系式的可信程度进行各种统计检验,并从影响某 一特定变量的诸多变量中找出哪些变量的影响显著,哪些一特定变量的诸多变量中找出哪些变量的影响显著,哪些 不显著不显著 利用所求的关系式,根据一个或几个变量的取值来预测或利用所求的关系式,根据一个或几个变量的取值来预测或 控制另一个特定变量的取值,并给出这种预测或控制的精控制另一个特定变量的取值,并给出这种预测或控制的精 确程度确程度 第五节第五节
20、 回归分析回归分析 药学统计学(2)31 回归模型回归模型 多元回归多元回归一元回归一元回归 线性线性 回归回归 非线性非线性 回归回归 线性回线性回 归归 非线性非线性 回归回归 药学统计学(2)32 (1 1)回答)回答“变量之间是什么样的关系?变量之间是什么样的关系?” (2 2)方程中运用)方程中运用 1 1个数字的因变量个数字的因变量( (响应变量响应变量)被预测的被预测的 变量变量 1 1个或多个数字的或分类的自变量个或多个数字的或分类的自变量 ( (解释变解释变 量量)用于预测的变量用于预测的变量 (3 3)主要用于预测和估计)主要用于预测和估计 药学统计学(2)33 (1 1)
21、当只涉及一个自变量时称为一元回归,若)当只涉及一个自变量时称为一元回归,若 因变量因变量 y y 与自变量与自变量 x x 之间为线性关系时之间为线性关系时 称为一元线性回归称为一元线性回归 (2 2)对于具有线性关系的两个变量,可以用一)对于具有线性关系的两个变量,可以用一 条线性方程来表示它们之间的关系条线性方程来表示它们之间的关系 (3 3)描述因变量)描述因变量 y y 如何依赖于自变量如何依赖于自变量 x x 的方的方 程称为回归模型程称为回归模型 药学统计学(2)34 Y = Y = 0+ 0+ 1 x1 x 方程的图示是一条直线,因此也称为直线回归方程的图示是一条直线,因此也称为
22、直线回归 方程方程 0 0是回归直线在是回归直线在 y y 轴上的截距,是当轴上的截距,是当 x=0 x=0 时时 y y 的期望值的期望值 1 1是直线的斜率,称为回归系数,表示当是直线的斜率,称为回归系数,表示当 x x 每变动一个单位时,每变动一个单位时,y y 的平均变动值的平均变动值 药学统计学(2)35 回归直线是对若干个数据对(回归直线是对若干个数据对(X,YX,Y)绘制)绘制 的,但由于遵守正态分布的实验误差,数据对的,但由于遵守正态分布的实验误差,数据对 中两个以上的点,不能恰好在一条直线上,即中两个以上的点,不能恰好在一条直线上,即 恰好通过所有数据点的直线是找不到的,只能
23、恰好通过所有数据点的直线是找不到的,只能 找到一条离所有点都近的直线,所用的客观方找到一条离所有点都近的直线,所用的客观方 法叫最小二乘法(法叫最小二乘法(method of least method of least squaressquares)。)。 药学统计学(2)36 (1 1)定义)定义 给定给定n n个数据对(个数据对(X,YX,Y),找到一条规定),找到一条规定X X,Y Y 关系的直线,使所有数据对(关系的直线,使所有数据对(X X,Y Y)与拟规定的)与拟规定的 直线在直线在Y Y轴方向的距离平方和最小轴方向的距离平方和最小用数学语用数学语 言表示就是言表示就是 最小,这样
24、的一条直线就最小,这样的一条直线就 是描述是描述X X,Y Y间关系的最佳直线,称为最小二乘线。间关系的最佳直线,称为最小二乘线。 n i i1 2 (Y - Y ) 药学统计学(2)37 (2 2)图示)图示 xy 10 药学统计学(2)38 (3 3) 和和 的计算公式的计算公式 0 1 xy xxn yxyxn n i n i ii n i i n i i n i ii 10 11 2 111 1 药学统计学(2)39 二、回归分析在药物研究中的应用二、回归分析在药物研究中的应用 例:把例:把6 6个浓度按两倍递增的纯青霉素溶液(个浓度按两倍递增的纯青霉素溶液(132U/ml132U/m
25、l)置于进行生物测)置于进行生物测 定的杯碟中。下表给出每一浓度以定的杯碟中。下表给出每一浓度以mmmm表示的抑菌圈直径,在这个长度表示的抑菌圈直径,在这个长度 的测量中发生较大的误差。如果对青霉素溶液的浓度的测量中发生较大的误差。如果对青霉素溶液的浓度C C取以取以2 2为底的对为底的对 数(笔,数(笔,binitbinit),则抑菌圈的直径与青霉素溶液的浓度成线性关系。),则抑菌圈的直径与青霉素溶液的浓度成线性关系。 试求试求Y Y在在X X上的回归直线方程。上的回归直线方程。 24.7723.1321.3519.5217.7815.87 Y抑菌抑菌 圈直径圈直径 /mm 543210Xl
26、og2C 32168421C/ml 表表 青霉素溶液浓度的对数变换青霉素溶液浓度的对数变换 药学统计学(2)40 解解 进行进行Y Y在在X X上的回归计算上的回归计算 X X15 n15 n6 Y6 Y122.42122.42 2.50 2.50 20.4020.40 X2 X255 XY55 XY337.24 Y2337.24 Y2 2553.38802553.3880 于是于是Y Y在在X X上的回归直线方程是上的回归直线方程是 15.9415.941.782X1.782X 1 0 187.14 1.782 105 20.24 2 (6)337.24(15)122.42 (6)55(15
27、) (1.782)2.5020.404.45515.94 X Y Y 药学统计学(2)41 第六节第六节 实验设计实验设计 (1 1)对照:齐同可比)对照:齐同可比 (2 2)重复:)重复:获得总体标准差的估计值获得总体标准差的估计值 用大容量样本重复多次获得的均用大容量样本重复多次获得的均 值,能把因素在实验中的效应估计得更精密。值,能把因素在实验中的效应估计得更精密。 (3 3)随机:有助于把可能存在得外部因素效应)随机:有助于把可能存在得外部因素效应 平均化而减免。平均化而减免。 一、实验设计的基本原理一、实验设计的基本原理 药学统计学(2)42 确认并陈述问题确认并陈述问题 选择因素和水平选择因素和水平 选择响应变量选择响应变量 选择实验设
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年高考英语全国新高考II卷深度解读及答案详解
- 公司工艺实施管理制度
- 公司生产条例管理制度
- 河南省驻马店市部分学校2025届高三下册2月质量检测数学试卷附解析
- 广东省佛山市顺德区2024-2025学年高一下册4月月考数学试卷附解析
- 东北三省部分高中联盟2025届高三第三次联合调研(4月)数学试卷附解析
- 2025年中考语文(长沙用)课件:复习任务群11 非文学作品阅读
- 2024~2025学年 浙江省绍兴市诸暨市高一语文上册11月期中试卷
- 专题三 联邦制、两党制、三权分立:以美国为例
- 2024年丽水市公安局辅警招聘真题
- 2025年农村集体土地上房屋买卖合同模板
- 定额〔2025〕1号文-关于发布2018版电力建设工程概预算定额2024年度价格水平调整的通知
- 白带常规报告单模板
- 2022年全国工会财务知识大赛参考题库精简600题(含各题型)
- 新教材教科版五年级下册科学全册课时练(课后作业设计)(含答案)
- 《国学典籍英译》课程教学大纲
- 校外毕业设计(实习)申请表模板.docx
- 钢管悬挑脚手架搭设方案
- 《厨余垃圾处理厂运行监管标准》(征求意见稿)
- 火灾报警控制器CAN联网
- 医疗纠纷防范和处理PPT课件
评论
0/150
提交评论