




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十章药学统计学统计学(statistics):研究数据的收集、描述、分析、综合和解释,以获得新信息、作出新推断的学科。包括: (1)制定调查方案和设计科学实验 (2)描述实验数据 (3)进行假设检验 (4)获知变量间的定量关系概 述第一节 几个基本统计学概念频率:概率:一、必然事件与随机事件必然事件:某条件实现后一定发生或一定不发生的事件随机事件:一定条件下,不一定发生的事件二、频率与概率1. 总体与样本的关系 样本参数用英文字母表示 总体参数用希腊字母表示总 体样 本 取样 观测数 据推 断三、总体与样本 2. 取样的随机性 随机性包括: 总体中个体的抽取必须是相互独立的; 总体中所有个体
2、被抽取的机会相等。 满足以上两个要求的取样,称为简单随机取样(SRS,simple random sampling) 这样抽取的样本称为简单随机样本。四、观测值的特征集中位置与离散程度量度集中位置的统计量(1)均值 样本均值 总体均值 E(X)取值概率XiPi 均值的重要性质: 观测值与均值之差(偏差)之和 偏差的平方和 最小 (2)众数 频数最大的观测值叫众数,常用于表示离散型随机变量的集中位置。(3)中位数 把变量的观测值按大小顺序排列,排在当中的一个观测值叫中位数。(1)极差 (最大值和最小值之差) RXmaxXmin(2)平均(绝对)偏差2. 量度数据离散程度的统计量(3)方差 式中n
3、1在统计学中叫自由度(degree of freedom),常用希腊字母表示五、两个典型的概率分布1. 二项分布是典型的离散型概率分布(1)特点: 二项分布是一种每次试验只有两种可能结果而不受以前实验影响的分布。在样本容量相对于总体很小时,取样试验后,返回不返回,对下一次试验的结果无影响。(2)二项分布的均值、方差、标准差 均值np 方差npq 标准差(3)二项分布的实际意义 一些只有两个结果的互斥事件都与二项分布有关,在药学方面,可用于分析从制剂批抽出n个个体中不合格个体数的概率。2. 正态分布是一种连续型概率分布,各种分布都以它为中心在一定条件下相互转化。 设连续性随机变量X的概率密度为
4、则称X服从参数为、 (- + , 0)的正态分布,记为XN( , )(1)特点: 极大值在; 以X为对称轴; X轴是渐进线;拐点在X。(2)标准正态分布一般的正态分布取决于均值和标准差 计算概率时 ,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表 任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布xms一般正态分布 =1Z标准正态分布 (3)标准正态分布表的使用将一个一般的转换为标准正态分布计算概率时 ,查标准正态概率分布表对于负的 x ,可由 (-x) x得到对于标准正态分布,即XN(0,1),有P
5、(a X b) b aP (|X| a) 2 a 1对于一般正态分布,即XN( , ),有六、均值的分布和中心极限定理均值的分布 如一个随机变量X呈总体均值为、总体方差为2的正态分布,则其容量为n的样本均值 也呈正态分布,其总体均值仍为,但总体方差为2 /n,即X2. 中心极限定理 设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布一个任意分布的总体X当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布第二节 取样 按与调查目的有关的某个主要性标志将总体单位划分为若干层(也称类、组或子总体),然后从多
6、层中按随机原则分别抽取一定数目的单位构成样本。一、随机取样与随机数表 简单随机抽样是最基本的抽样组织方式。是对总体单位不进行任何划分或排队,完全随机地直接从总体中抽取样本单位,使每个总体单位都有完全均等的机会被抽中。二、分层取样 在大规模生产中,表明供应方产品质量特征的随机变量应不超出某规定范围。三、系统取样 常用于质量控制,每第n个个体选取一个,但最初选取的个体是随机的。四、验收取样第三节 数据制图 与统计方法有关的图解: 以传递信息为目的的图解: 如直方图、条形图 在坐标中描述变量之间关系的图解一、引言 在许多研究数据中,响应Y的对数而不是Y本身与独立变量X呈线性关系,这样就要进行半对数标
7、绘,即变量X的坐标是自然数而响应(函数)Y的是它的对数logY。二、描述频数的图解直方图、条形图、扇形图三、描述变量关系的标绘图第四节 统计估计和假设检验统计方法描述统计推断统计统计估计假设检验 样本统计量均值 和方差S2分别是其总体均值和总体方差2的最佳估计。 置信区间(confidence interval):是我们相信统计量如总体均数所在的区间,由总体的性质、参数的样本估计值和想达到的置信度决定。 以样本均值为对称中心的双侧置信区间: P置信区间X一、统计估计1. 用t分布确定置信区间 P置信区间2. 几个不同置信区间的构造(1)未知,需要由样本估计(2)已知,直接代入公式(3)比率的置
8、信区间一、统计估计二、假设检验1. 引言(1)概念事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立(2)类型参数假设检验非参数假设检验(3)特点采用逻辑上的反证法依据统计上的小概率原理 零假设(null hypothesis): 关于两个总体在某一参数如均值上一致(实际上差异为零)的假设H0。 如 H0:12 备择假设(alternative hypothesis):如果舍弃H0则接受Ha,Ha也可用H1表示。 如Ha:12例:表 观测单一总体均值的实验示例同类药物的治愈率新药的治愈率值得临床研究重视得血压降低标准值临床前研究中n只大鼠血压降低均值药典片剂通则关于崩解时
9、限的规定药片片剂平均崩解时限标示量药片片剂的平均含量假设值或标准值样本均值对此例中每一类问题的假设检验,可提出三个假设检验:H0:=0,Ha: 0 H0:=0,Ha:02. 检验假设的步骤(1)提出检验统计量T并进行实验(2)提出零假设H0和备择假设Ha(3)规定显著性水平 显著性水平:即根据统计检验的结果舍弃零假设H0(存在显著差异)而实际上不存在的概率。(4)计算检验统计量T并进行显著性检验3. 几种具体的假设检验(1)已知的单样本双侧均值检验(2)已知的单样本单侧均值检验(3)未知的单样本双侧均值检验 先求t值,再计算置信区间,进行t检验(4)独立样本方差S12和S22的比较:F检验1.
10、 什么是回归分析:从一组样本数据出发,确定变量之间的数学关系式对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度第五节 回归分析2. 回归模型的类型一个自变量两个及两个以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归3. 回归模型(1)回答“变量之间是什么样的关系?”(2)方程中运用1个数字的因变量(响应变量)被预测的变量1个或多个数字的或分类的自变量 (解释变量)用于预测的变量(3)主要用于预测和估计概念要点(
11、1)当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归(2)对于具有线性关系的两个变量,可以用一条线性方程来表示它们之间的关系(3)描述因变量 y 如何依赖于自变量 x 的方程称为回归模型5. 简单线性回归方程的形式如下 Y = 0+ 1 x 方程的图示是一条直线,因此也称为直线回归方程 0是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值 1是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值6. 最小二乘法 回归直线是对若干个数据对(X,Y)绘制的,但由于遵守正态分布的实验误差,数据对中两个以上的点,不能恰好在一条
12、直线上,即恰好通过所有数据点的直线是找不到的,只能找到一条离所有点都近的直线,所用的客观方法叫最小二乘法(method of least squares)。7. 最小二乘线 (1)定义 给定n个数据对(X,Y),找到一条规定X,Y关系的直线,使所有数据对(X,Y)与拟规定的直线在Y轴方向的距离平方和最小用数学语言表示就是 最小,这样的一条直线就是描述X,Y间关系的最佳直线,称为最小二乘线。(2)图示xy(xn , yn)(x1 , y1)(x2 , y2)(xi , yi)ei = yi-yi(3) 和 的计算公式二、回归分析在药物研究中的应用例:把6个浓度按两倍递增的纯青霉素溶液(132U/
13、ml)置于进行生物测定的杯碟中。下表给出每一浓度以mm表示的抑菌圈直径,在这个长度的测量中发生较大的误差。如果对青霉素溶液的浓度C取以2为底的对数(笔,binit),则抑菌圈的直径与青霉素溶液的浓度成线性关系。试求Y在X上的回归直线方程。24.7723.1321.3519.5217.7815.87Y抑菌圈直径/mm543210Xlog2C32168421C/ml 表 青霉素溶液浓度的对数变换解 进行Y在X上的回归计算 X15 n6 Y 2.50 X255 XY337.24 Y2 于是Y在X上的回归直线方程是 X 第六节 实验设计1. 基本原理(1)对照:齐同可比(2)重复:获得总体标准差的估计
14、值 用大容量样本重复多次获得的均值,能把因素在实验中的效应估计得更精密。(3)随机:有助于把可能存在得外部因素效应平均化而减免。一、实验设计的基本原理2. 步骤 确认并陈述问题 选择因素和水平 选择响应变量 选择实验设计 进行实验 分析数据 做结论并提建议二、方差分析(analysis of variance,ANOVA) 方差分析能确定引起生产和实验结果有差异的诸因素各自的单独作用和彼此的交互作用。 变差的大小通常用变差平方和(简称平方和)表示 平方和的加和性:总平方和等于各因素平方和与误差平方和之和,即 SStotSSASSBSSe三、实验设计的分类1. 两类基本的实验设计 等级分类 交叉分类2. 两类不同性质的因素 固定的 随机的3. 配置完整和不完整第七节 几个现代统计方法1. 概述 蒙特卡洛方法根据模拟抽样的结果估算求解问题解X的近似值。这样的近似值通常是以一个数学期望等于X的统计量的样本均值给出。2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- T/CACE 034.2-2022基于项目的温室气体减排量评估技术规范循环经济领域资源化过程废旧电池产品回收处理
- 地理-亚洲的自然环境课时2课件 2024-2025学年人教版地理七年级下册
- T/CA 105-2019手机壳套通用规范
- T/BMPA 0001-2023再生水供用双方协商价格行为指南
- T/BJWX 004-2024会议服务管理规范
- 特殊心理健康教育
- 腰椎间盘突出患者的康复护理
- 新生儿血小板减少护理查房
- 《物联网运维与服务》课件 5.3-园区数字化监控系统的AIoT平台日常运行监控
- 《观察物体》参考课件2
- SL631水利水电工程单元工程施工质量验收标准第3部分:地基处理与基础工程
- 2025时政试题及答案(100题)
- 新22J01 工程做法图集
- 2024秋期国家开放大学本科《经济学(本)》一平台在线形考(形考任务1至6)试题及答案
- 2025年中考历史复习专项训练:中国近代史材料题40题(原卷版)
- 2024年建筑业10项新技术
- 景区运营管理服务合同
- 预算管理业务流程图
- JJG 930-2021基桩动态测量仪 _(高清正版)
- 县疾控中心中层干部竞聘上岗实施方案.doc
- 液压爬模检查记录表
评论
0/150
提交评论