生物统计学课后习题的答案(杜荣骞第三版)_第1页
生物统计学课后习题的答案(杜荣骞第三版)_第2页
生物统计学课后习题的答案(杜荣骞第三版)_第3页
生物统计学课后习题的答案(杜荣骞第三版)_第4页
生物统计学课后习题的答案(杜荣骞第三版)_第5页
已阅读5页,还剩128页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

...wd......wd......wd...第一章统计数据的收集与整理1.1算术平均数是怎样计算的为什么要计算平均数答:算数平均数由下式计算:,含义为将全部观测值相加再被观测值的个数除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点,或是说是样本数据的代表。1.2既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。1.3标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。1.4完整地描述一组数据需要哪几个特征数答:平均数、标准差、偏斜度和峭度。1.5下表是我国青年男子体重〔kg〕。由于测量精度的要求,从外表上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。666964656466686562646961616866576669666570645867666667666662666664626265646566726066656161666762656561646264656265686865676862637065646562666263686568576766686364666864636064696566676767656767666864675966656356666363666763706770626472696767666864657161636164646769706664656463706462697068656365666468696563676370656867696665676674646965646565686765656667726567626771696565756269686865636666656261686564676664606168676359656064636962716960635967616869666469656867646466697368606063386267656569656765726667646164666363666666636563676866626361666163686566696466706970636465646767656662616565606365626664答:首先建设一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat。所用的SAS程序和计算结果如下:procformat;valuehfmt56-57='56-57'58-59='58-59'60-61='60-61'62-63='62-63'64-65='64-65'66-67='66-67'68-69='68-69'70-71='70-71'72-73='72-73'74-75='74-75';run;dataweight;infile'E:\data\exer1-5e.dat';inputbw@@;run;procfreq;tablebw;formatbwhfmt.;run;TheSASSystemCumulativeCumulativeBWFrequencyPercentFrequencyPercent-----------------------------------------------------56-5731.031.058-5941.372.360-61227.3299.762-634615.37525.064-658327.715852.766-677725.723578.368-694515.028093.370-71134.329397.772-7351.729899.374-7520.7300100.01.6将上述我国男青年体重看作一个有限总体,用随机数字表从该总体中随机抽出含量为10的两个样本,分别计算它们的平均数和标准差并进展比较。它们的平均数相等吗标准差相等吗能够解释为什么吗答:用means过程计算,两个样本分别称为和,结果见下表:TheSASSystemVariableNMeanStdDev----------------------------------------Y11064.50000003.5039660Y21063.90000003.1780497----------------------------------------随机抽出的两个样本,它们的平均数和标准差都不相等。因为样本平均数和标准差都是统计量,统计量有自己的分布,很难得到平均数和标准差都相等的两个样本。1.7从一个有限总体中采用非放回式抽样,所得到的样本是简单的随机样本吗为什么本课程要求的样本都是随机样本,应当采用哪种抽样方法,才能获得一随机样本答:不是简单的随机样本。从一个有限总体中以非放回式抽样方法抽样,在前后两次抽样之间不是相互独立的,后一次的抽样结果与前一次抽样的结果有关联,因此不是随机样本。应采用随机抽样的方法抽取样本,具体说应当采用放回式抽样。1.8证明假设用或编码时,前式是否仍然相等答:〔1〕令那么平均数特性之③。〔2〕令那么平均数特性之②。用第二种编码方式编码结果,两式不再相等。1.9有一个样本:,设B为其中任意一个数值。证明只有当最小。这是平均数的一个重要特性,在后面讲到一元线型回归时还会用到该特性。答:令,为求使p达最小之B,令那么。1.10检测菌肥的成效,在施有菌肥的土壤中种植小麦,成苗后测量苗高,共100株,数据如下[1]:10.09.37.29.18.58.010.510.69.610.17.06.79.57.810.57.98.19.67.69.410.07.57.25.07.38.77.16.15.26.810.09.97.54.57.67.09.76.28.06.98.38.610.04.84.97.08.38.47.87.56.610.06.59.58.511.09.76.610.05.06.58.08.48.37.47.48.17.77.57.17.87.68.66.07.06.46.76.36.411.010.57.85.08.07.07.45.26.79.08.64.66.93.56.29.76.45.86.49.36.4编制苗高的频数分布表,绘制频数分布图,并计算出该样本的四个特征数。答:首先建设一个外部数据文件,名称和路径为:E:\data\exr1-10e.dat。SAS程序及结果如下:optionsnodate;procformat;valuehfmt3.5-4.4='3.5-4.4'4.5-5.4='4.5-5.4'5.5-6.4='5.5-6.4'6.5-7.4='6.5-7.4'7.5-8.4='7.5-8.4'8.5-9.4='8.5-9.4'9.5-10.4='9.5-10.4'10.5-11.4='10.5-11.4';run;datawheat;infile'E:\data\exr1-10e.dat';inputheight@@;run;procfreq;tableheight;formatheighthfmt.;run;proccapabilitygraphicsnoprint;varheight;histogram/vscale=count;insetmeanvarskewnesskurtosis;run;TheSASSystemTheFREQProcedureCumulativeCumulativeheightFrequencyPercentFrequencyPercent---------------------------------------------------------------------3.5-4.411.0011.004.5-5.499.001010.005.5-6.41111.002121.006.5-7.42323.004444.007.5-8.42424.006868.008.5-9.41111.007979.009.5-10.41515.009494.0010.5-11.466.00100100.001.11北太平洋宽吻海豚羟丁酸脱氢酶〔HDBH〕数据的接收范围频数表[2]如下:〔略作调整〕HDBH数据的接收范围/(U·L-1)频数<2141<245.90913<277.818211<309.727319<341.636426<373.545522<405.454511<437.363613<469.27276<501.18183<533.09092根据上表中的数据作出直方图。答:以表中第一列所给出的数值为组界,直方图如下:1.12灵长类手掌和脚掌可以握物一侧的皮肤外表都有突起的皮肤纹嵴。纹嵴有许多特征,这些特征在胚胎形成之后是终生不变的。人类手指尖的纹型,大致可以分为弓、箕和斗三种类型。在手指第一节的基部可以找到一个点,从该点纹嵴向三个方向辐射,这个点称为三叉点。弓形纹没有三叉点,箕形纹有一个三叉点,斗形纹有两个三叉点,记录从三叉点到箕或斗中心的纹嵴数目称为纹嵴数〔fingerridgecount,FRC〕。将双手十个指尖的全部箕形纹的纹嵴数和/或斗形纹两个纹嵴数中较大者相加,称为总纹嵴数〔totalfingerridgecount,TFRC〕。下表给出了大理白族人群总纹嵴数的频数分布[3]:TFRC分组中值频数11~3020231~5040151~7060871~90802991~110100541111501406815119018018191~2102006首先判断数据的类型,然后绘出样本频数分布图,计算样本的四个特征数并描述样本分布形态。答:总纹脊数属计数数据。计数数据的频数分布图为柱状图,频数分布图如下:样本特征数〔以TFRC的中值计算〕SAS程序:optionsnodate;datatfrc;doi=1to10;inputy@@;inputn@@;doj=1ton;output;end;end;cards;202401608802910054120631406816051180182006;run;procmeansmeanstdskewnesskurtosis;vary;run;结果见下表:TheSASSystemAnalysisVariable:YMeanStdDevSkewnessKurtosis------------------------------------------------------126.533333332.8366112-0.2056527-0.0325058------------------------------------------------------从频数分布图可以看出,该分布的众数在第七组,即总纹脊数的中值为140的那一组。分布不对称,平均数略小于众数,有些负偏。偏斜度为-0.2056527,偏斜的程度不是很明显,基本上还可以认为是对称的,峭度几乎为零。1.13海南粗榧叶长度的频数分布[4]:叶长度/mm中值频数2.0~2.22.13902.2~2.42.314342.4~2.62.526432.6~2.82.735462.8~3.02.956923.0~3.23.151873.2~3.43.343333.4~3.63.527673.6~3.83.716773.8~4.03.91137nag4.0~4.24.16674.2~4.44.33464.4~4.64.5181绘出频数分布图,并计算偏斜度和峭度。答:表中第一列所给出的数值为组限,以以下图为海南粗榧叶长度的频数分布图。计算偏斜度和峭度的SAS程序和计算结果如下:optionsnodate;datalength;doi=1to13;inputy@@;inputn@@;doj=1ton;output;end;end;cards;2.13902.314342.526432.735462.956923.151873.343333.527673.716773.911374.16674.33464.5181;run;procmeansnskewnesskurtosis;vary;run;TheSASSystemAnalysisVariable:YnSkewnessKurtosis---------------------------------300000.41064580.0587006---------------------------------样本含量n=30000,是一个很大的样本,样本的偏斜度和峭度都已经很可靠了。偏斜度为0.41,有一个明显的正偏。1.14马边河贝氏高原鳅繁殖群体体重分布如下[5]:体质量/g中值雌鱼雄鱼2.00~3.002.50143.00~4.003.50674.00~5.004.5013115.00~6.005.5030256.00~7.006.5025257.00~8.007.5016238.00~9.008.5021179.00~10.009.50181610.00~11.0010.5012411.00~12.0011.50312.00~13.0012.502首先判断数据的类型,然后分别绘制雌鱼和雄鱼的频数分布图,计算样本平均数、标准差、偏斜度和峭度并比较两者的变异程度。答:鱼的体重为度量数据,表中第一列所给出的数值为组限。在下面的分布图中雌鱼和雄鱼的分布绘在了同一张图上,以不同的颜色表示。计算统计量的SAS程序与前面的例题类似,这里不再给出,只给出结果。雌鱼:TheSASSystemAnalysisVariable:YNMeanStdDevSkewnessKurtosis-----------------------------------------------------------1477.24149662.14568200.2318337-0.6758677-----------------------------------------------------------雄鱼:TheSASSystemAnalysisVariable:YNMeanStdDevSkewnessKurtosis-----------------------------------------------------------1326.78030301.9233971-0.1322816-0.5510332-----------------------------------------------------------直观地看,雄鱼的平均体重低于雌鱼。雌鱼有一正偏,雄鱼有一负偏。因此,相对来说雌鱼低体重者较多,雄鱼高体重者较多。但两者都有很明显的负峭度,说明“曲线〞较平坦,两尾翘得较高。1.15黄胸鼠体重的频数分布[6]:组界/g频数0<≤151015<≤302630<≤453045<≤602260<≤752275<≤901790<≤10516105<≤12014120<≤1356135<≤1504150<≤1652总数169绘制频数分布图,从图形上看分布是对称的吗,说明什么问题答:下面是频数分布图:从上图可见,图形不是对称的,有一些正偏。说明在该黄雄鼠群体中,低体重者分布数量,高于高体重者的数量。另外,似乎峭度也有些低。1.1625名患者入院后最初的白细胞数量〔×103〕[7]如下表:851241168771273111411966561014455计算白细胞数量的平均数、方差和标准差。答:用means过程计算,程序不再给出,只给出运行结果。TheSASSystemAnalysisVariable:YNMeanVarianceStdDev-------------------------------------------257.840000010.30666673.2103998--------------------------------------------1.17细胞珠蛋白基因〔CYGB〕可能是非小细胞肺癌〔NSCLC〕的抑制基因之一。一个研究小组研究了该基因的表达、启动子甲基化和等位基因不平衡状态等,以便发现它与肿瘤发病间的关联。下面列出了其中15名患者的基因表达〔肿瘤患者/正常对照,T/N〕,肿瘤患者与正常对照甲基化指数差〔MtIT-MtIN〕[8]:样本号T/NMtIT-MtIN3570.0140.4193700.0190.0173670.0350.1053160.0440.3333690.0540.1703580.0840.2463030.1110.2423140.1350.3643080.2360.0513100.2530.5203410.2640.2003480.3150.1033230.3590.1673600.4220.1763360.4420.037计算以上两项指标的平均数和标准差并计算两者的变异系数,这两个变异系数可以比较吗为什么答:记T/N为,MtIT-MtIN为,用means过程计算,SAS运行的结果见下表:TheSASSystemVariableNMeanStdDevCV------------------------------------------------------Y1150.18580000.150562481.0346471Y2150.21000000.146527469.7749634------------------------------------------------------两个变异系数是可以比较的,因为它们的标准差都是用平均数标准化了的,已经不存在不同单位的影响了。第二章概率和概率分布2.1做这样一个试验,取一枚五分硬币,将图案面称为A,文字面称为B。上抛硬币,观察落下后是A向上还是B向上。重复10次为一组,记下A向上的次数,共做10组。再以100次为一组,1000次为一组,各做10组,分别统计出A的频率,验证2.1.3的内容。答:在这里用二项分布随机数模拟一个抽样试验,与同学们所做的抽样试验并不冲突。以变量Y表示图向上的次数,n表示重复的次数,m表示组数,每次落下后图向上的概率φ=1/2。SAS程序如下,该程序应运行3次,第一次n=10,第二次n=100,第三次n=1000。optionsnodate;datavalue;n=10;m=10;phi=1/2;doi=1tom;retainseed3053177;doj=1ton;y=ranbin(seed,n,phi);output;end;end;datadisv;setvalue;byi;iffirst.ithensumy=0;sumy+y;meany=sumy/n;py=meany/n;iflast.ithenoutput;keepnmphimeanypy;run;procprint;title'binomialdistribution:n=10m=10';run;procmeansmean;varmeanypy;title'binomialdistribution:n=10m=10';run;以下的三个表是程序运行的结果。表的第一局部为每一个组之Y的平均结果,包括平均的频数和平均的频率,共10组。表的第二局部为10组数据的平均数。从结果中可以看出,随着样本含量的加大,样本的频率围绕0.5做平均幅度越来越小的波动,最后稳定于0.5。binomialdistribution:n=10m=10OBSNMPHIMEANYPY110100.55.70.57210100.54.50.45310100.55.10.51410100.56.10.61510100.56.10.61610100.54.30.43710100.55.60.56810100.54.70.47910100.55.20.521010100.55.60.56binomialdistribution:n=10m=10VariableMean----------------------MEANY5.2900000PY0.5290000----------------------binomialdistribution:n=100m=10OBSNMPHIMEANYPY1100100.549.710.49712100100.549.580.49583100100.550.370.50374100100.550.110.50115100100.549.700.49706100100.550.040.50047100100.549.200.49208100100.549.740.49749100100.549.370.493710100100.549.860.4986binomialdistribution:n=100m=10VariableMean----------------------MEANY49.7680000PY0.4976800----------------------binomialdistribution:n=1000m=10OBSNMPHIMEANYPY11000100.5499.2780.4992821000100.5499.6790.4996831000100.5499.1080.4991141000100.5500.0460.5000551000100.5499.8170.4998261000100.5499.2360.4992471000100.5499.5310.4995381000100.5499.9360.4999491000100.5500.0110.50001101000100.5500.3040.50030binomialdistribution:n=1000m=10VariableMean----------------------MEANY499.6946000PY0.4996946----------------------2.2每个人的一对第1号染色体分别来自祖母和外祖母的概率是多少一位男性的X染色体来自外祖父的概率是多少来自祖父的概率呢答:〔1〕设A为一对第1号染色体分别来自祖母和外祖母的事件,那么〔2〕设B为男性的X染色体来自外祖父的事件,那么〔3〕设C为男性的X染色体来自祖父的事件,那么2.3假设父母的基因型分别为IAi和IBi。他们的两个孩子都是A型血的概率是多少他们生两个O型血女孩的概率是多少答:父:母:2.4白化病是一种隐性遗传病,当隐性基因纯合时〔aa〕即发病。杂合子〔Aa〕在群体中的频率为1/70,问一对夫妻生出一名白化病患儿的概率是多少假设妻子是白化病患者,她生出白化病患儿的概率又是多少答:〔1〕所以〔2〕所以2.5在图2-3中,III1为Aa个体,a在群体中的频率极低,可排除a多于一次进入该系谱的可能性,问III2亦为a的携带者的概率是多少答:设:事件A:III1含a,事件B:II2含a,事件C:I3含a,事件D:II2含a,事件E:III2含a,事件C’:I4含a,图2-3同理可得:故III2含a总的概率为:2.6一个杂合子AaBb自交,子代基因型中有哪些基本领件可举出哪些事件各事件的概率是多少答:1.共有16种基因型,为16个基本领件。AABBAAbBaABBaAbBAABbAAbbaABbaAbbAaBBAabBaaBBaabBAaBbAabbaaBbaabb2.可举出的事件及其概率:A1:包含四个显性基因={AABB}A2:包含三个显性基因={AABb,AAbB,AaBB,aABB}A3:至少包含三个显性基因={AABb,AAbB,AaBB,aABB,AABB}A4:包含两个显性基因={AaBb,AabB,aABb,aAbB,AAbb,aaBB}A5:至少包含两个显性基因={AaBb,AabB,aABb,aAbB,AAbb,aaBBAABb,AAbB,AaBB,aABB,AABB}A6:包含两个不同的显性基因={AaBb,AabB,aABb,aAbB}A7:包含两个一样的显性基因={AAbb,aaBB}⋮2.7一对表型正常的夫妻共有四名子女,其中第一个是隐性遗传病患者。问其余三名表型正常的子女是隐性基因携带者的概率是多少答:样本空间W={AA,Aa,aA}2.8自毁容貌综合征是一种X连锁隐性遗传病,图2-4是一个自毁容貌综合征患者的家系图。该家系中III2的两位舅父患有该病,III2想知道她的儿子患该病的概率是多少〔提示:用Bayes定理计算II5在已生四名正常男孩的条件下是携带者的条件概率〕图2-4答:假设IV1是患者,III2必定是携带者,II5亦必定是携带者。II2和II3为患者,说明I2为杂合子,这时II5可能是显性纯合子也可能是杂合子。称II5是杂合子这一事件为A1,II5是显性纯合子这一事件为A2图2-4设II5生4名正常男孩的事件为事件B,那么II5为杂合子的条件下,生4名正常男孩〔III3至III6〕的概率为:II5为显性纯合子的条件下,生4名正常男孩的概率为:将以上各概率代入Bayes公式,可以得出在已生4名正常男孩条件下,II5为杂合子的概率:由此得出III2为杂合子的概率:P〔III2为杂合子〕以及III2的儿子〔IV1〕为受累者的概率:P〔IV1为患者〕2.9Huntington舞蹈病是一种由显性基因引起的遗传病,发病年龄较迟,图2-5为一Huntington舞蹈病的家系图。III1的外祖父I1患有该病,III1现已25岁,其母II2已43岁,均无发病迹象。43岁以前发病的占64%,25岁以前发病的占8%,问III1将发病的概率是多少〔提示:用Bayes定理先求出II2尚未发病但为杂合子的条件概率〕答:根据以上资料可以得出:II2为杂合子的概率II2为正常纯合子的概率II2为杂合子,但尚未发病的概率=0.36II2为正常纯合子,但尚未发病的概率图2-5因此,II2尚未发病但为杂合子的概率III1为杂合子的概率III1为正常纯合子的概率III1为杂合子,但尚未发病的概率III1为正常纯合子,但尚未发病的概率因此,III1尚未发病,但为杂合子的概率所以,III1为该病患者的概率为12%。2.10一实验动物养殖中心,将每30只动物装在一个笼子中,其中有6只动物体重不合格。购置者从每一笼子中随机抽出2只称重,假设都合格那么承受这批动物,否那么拒绝。问:〔1〕检查第一只时就不合格的概率〔2〕第一只合格,第二只不合格的概率〔3〕承受这批动物的概率答:〔1〕设A为第一只不合格的事件,那么〔2〕设B为第二只不合格的事件,那么〔3〕承受这批动物的概率2.11一名精神科医生听取6名研究对象对近期所做梦的表达,得知其中有3名为忧郁症患者,3名是安康者,现从6名研究对象中选出3名,问:〔1〕一共有多少种配合〔2〕每一种配合的概率〔3〕选出3名忧郁症患者的概率〔4〕至少选出两名忧郁症患者的概率答:〔1〕〔2〕〔3〕〔4〕2.12图2-6为包含两个平行亚系统的一个组合系统。每一个亚系统有两个连续控制单元,只要有一个亚系统可正常工作,那么整个系统即可正常运行。每一单元失灵的概率为0.1,且各单元之间都是独立的。问:〔1〕全系统可正常运行的概率〔2〕只有一个亚系统失灵的概率图2-6〔3〕系统不能正常运转的概率答:〔1〕P〔全系统可正常运行〕=0.94+0.93×0.1×4+0.92×0.12×2=0.9639〔2〕P〔只有一个亚系统失灵〕=0.92×0.12×2+0.93×0.1×4=0.3078〔3〕P〔系统不能正常运转〕=0.14+0.13×0.9×4+0.12×0.92×4=0.0361或=1–0.9639=0.03612.13做医学研究需购置大鼠,根据研究的不同需要,可能购置A,B,C,D四个品系中的任何品系。实验室需预算下一年度在购置大鼠上的开支,下表给出每一品系50只大鼠的售价及其被利用的概率:品系每50只的售价/元被利用的概率A500.000.1B750.000.4C875.000.3D100.000.2问:〔1〕设Y为每50只大鼠的售价,期望售价是多少〔2〕方差是多少答:〔1〕〔2〕2.14Y为垂钓者在一小时内钓上的鱼数,其概率分布如下表:y0123456p(y)0.0010.0100.0600.1850.3240.3020.118问:〔1〕期望一小时内钓到的鱼数〔2〕它们的方差答:0×0.001+1×0.010+2×0.060+3×0.185+4×0.324+5×0.302+6×0.118=4.2σ2=02×0.001+12×0.010+22×0.060+32×0.185+42×0.324+52×0.302+62×0.118–4.22=1.2572.15一农场主租用一块河滩地,假设无洪水,年终可望获利20000元。假设出现洪灾,他将赔掉12000元〔租地费、种子、肥料、人工费等〕。根据常年经历,出现洪灾的概率为0.4。问:〔1〕农场主期望赢利〔2〕保险公司应允假设投保1000元,将补偿因洪灾所造成的损失,农场主是否买这一保险〔3〕你认为保险公司收取的保险金是太多还是太少答:〔1〕未投保的期望赢利:E〔X〕=20000×0.6+(12000)×0.4=7200〔元〕〔2〕投保后的期望赢利:E〔X〕=(20000–1000)×0.6+(−1000)×0.4=11000〔元〕。当然要买这一保险。〔3〕保险公司期望获利:E〔X〕=1000×0.6+(−12000+1000)×0.4=−3800〔元〕收取保险金太少。第三章几种常见的概率分布律3.1有4对相互独立的等位基因自由组合,问有3个显性基因和5个隐性基因的组合有多少种每种的概率是多少这一类型总的概率是多少答:代入二项分布概率函数,这里φ=1/2。结论:共有56种,每种的概率为0.00390625(1/256),这一类型总的概率为0.21875。3.25对相互独立的等位基因间自由组合,表型共有多少种它们的比方何答:〔1〕表型共有1+5+10+10+5+1=32种。〔2〕它们的比为:243∶81(×5)∶27(×10)∶9(×10)∶3(×5)∶1。3.3在辐射育种实验中,经过处理的单株至少发生一个有利突变的概率是φ,群体中至少出现一株有利突变单株的概率为Pa,问为了至少得到一株有利突变的单株,群体n应多大答:φ为单株至少发生一个有利突变的概率,那么1―φ为单株不发生一个有利突变的概率为:3.4根据以往的经历,用一般的方法治疗某疾病,其死亡率为40%,治愈率为60%。今用一种新药治疗染上该病的5名患者,这5人均治愈了,问该项新药是否显著地优于一般疗法〔提示:计算一般疗法5人均治愈的概率,习惯上当P〔5人均治愈〕>0.05时,那么认为差异不显著;当P〔5人均治愈〕<0.05时,那么认为差异显著〕。答:设P〔治愈〕=φ=0.60,那么5人均治愈的概率为:P=p5=(0.60)5=0.07776P>0.05所以该药物并不优于一般疗法。3.5给一组雌雄等量的实验动物服用一种药物,然后对存活的动物分成5只为一组,进展抽样试验。试验结果说明,5只均为雄性的频率为1/243,问该药物对雌雄的致死作用是否一致答:设p为处理后雄性动物存活的概率,那么因此,对雄性动物的致死率高于对雌性动物的致死率。3.6把成年椿象放在−8.5℃死虫数012345678910合计样本数421282214821000100计算理论频数,并与实际频数做一比较。答:先计算死虫数C:C=0×4+1×21+2×28+3×22+4×14+5×8+6×2+7×1=258死虫率φ=258/1000=0.258活虫率1–φ=0.742展开二项式〔0.742+0.258〕10得到以下结果:0.05059+0.17590+0.27522+0.25519+0.15528+0.06479+0.018774+3.7302×10-3+4.8638×10-4+3.7582×10-5+1.307×10-6将以上各频率乘以100得到理论频数,并将实际数与理论数列成下表。死虫数实际数理论数偏差045.1-1.112117.23.822827.50.532225.5-3.541415.5-1.5586.51.5621.90.1710.40.680009000100003.7人类染色体一半来自父亲,一半来自母亲。在减数分裂时,46条染色体随机分配到两极,假设不考虑染色体内重组,父亲的22条常染色体重新聚集在一极的概率是多少12条父亲染色体和11条母亲染色体被分配到同一极的概率又是多少常染色体的组合共有多少种从上述的计算可以看出变异的广泛性,假设再考虑染色体内重组,新组合染色体的数目就更惊人了。答:〔1〕P〔父亲22条常染色体重新聚集于同一极〕=〔2〕P〔12条父亲染色体和11条母亲染色体被分配到同一极〕=〔3〕共有222=4194304种。3.8生男生女的概率各为1/2,问在一个医院中,连续出生30名男孩及30名性别交织的新生儿的概率各为多少答:P〔连续出生30名男孩〕=P〔30名性别交织不同者〕=3.9在显性基因频率很低时,出现显性性状的个体一般为杂合子。一名女子是蓬发者〔显性性状〕,在她的全部六名孩子中,〔1〕其中第一名孩子,〔2〕其中第一和第二名孩子,〔3〕全部六名孩子,〔4〕任何一名曾孙〔或曾孙女〕中,发生蓬发的概率是多少答:设:P〔子女蓬发〕=φ=1/2P〔子女非蓬发〕=1–φ=1/2那么〔1〕P〔其中第一名子女蓬发〕=(1/2)(1/2)5=0.015625〔2〕P〔只有第一和第二名孩子蓬发〕=(1/2)2(1/2)4=0.015625〔3〕P〔全部六名子女〕=(1/2)6=0.015625〔4〕P〔任何一名曾孙蓬发〕=P〔任何一名儿子蓬发〕P〔任何一名孙子蓬发|蓬发的儿子〕P〔任何一名曾孙蓬发|蓬发的孙子〕=(1/2×1/2)(1/2×1/2)(1/2×1/2)=0.0156253.10在数量性状遗传中,F1的性状介于双亲之间,F2的性状向双亲方向别离。这是一个二项分布问题,根据二项展开式,计算控制某性状的基因个数,假设出现亲本性状的频率为a。答:设:P〔正效应基因频率〕=p那么3.11计算μ=0.1,0.2,1,2,5时,泊松分布的γ1和γ2,绘制概率分布图并做比较。答:泊松分布的概率函数:将μ=0.1,0.2,1,2,5分别代入上式。〔1〕μ=0.1时yp(y)00.904810.0904820.00452430.000150840.00000377〔2〕μ=0.2时yp(y)00.818710.163720.0163930.00109240.00005458〔3〕μ=1时yp(y)00.367910.367920.183930.0613140.0153350.00306660.000510970.00007299〔4〕μ=2时yp(y)yp(y)00.135360.0120310.270770.00343720.270780.000859330.180490.000190940.09022100.0000381950.03609〔5〕μ=5时yp(y)yp(y)00.00673890.0362710.03369100.0181320.08422110.00842430.1404120.00343440.1755130.00132150.1755140.000471760.1462150.000157270.1044160.0000491480.06528可见,随着μ的增大泊松分布越来越接近于“正态〞的。3.12随机变量Y服从正态分布N(5,42),求P(Y≤0),P(Y≤10),P(0≤Y≤15),P(Y≥5),P(Y≥15)的值。答:或者使用SAS程序计算,结果见下表:OBSMUSIGMAY1LOWERPY2UPPERPMIDP154100.89435...25400.10565...35400.10565150.006210.88814454..50.50000.554..150.00621.3.13随机变量Y服从正态分布N(0,52),求y0分别使得P(Y≤y0)=0.025,P(Y≤y0)=0.01,P(Y≤y0)=0.95及P(Y≥y0)=0.90。答:3.14细菌突变率是指单位时间〔细菌分裂次数〕内,突变事件出现的频率。然而根据以上定义直接计算突变率是很困难的。例如,向一试管中接种一定量的细菌,振荡培养后铺平板。在平板上发现8个突变菌落。这8个突变细菌终究是8个独立的突变事件呢,还是一个突变细胞的8个子细胞是很难确定的。但是有一点是可以肯定的,即,没有发现突变细胞的平皿一定没有突变事件出现。向20支试管中分别接种2×107个大肠杆菌,振荡培养后铺平板,同时接种T1噬菌体。结果在9个平皿中出现数量不等的抗T1噬菌体菌落。11个平皿上没有出现。平皿上突变菌落数服从泊松分布并且细胞分裂次数近似等于铺平板时的细胞数。利用泊松分布概率函数计算抗T1突变率。答:接种细胞数为n,n即可认为是细胞分裂次数。假设每一次细胞分裂的突变率为u,那么每一试管中平均有un次突变事件发生〔μ〕。从泊松分布概率函数可知,无突变发生的概率f(0)=E-un。实验结果无突变的平皿数为11个,即f(0)=11/20=0.55。解下式即可求出突变率u。n=0.2×108,代入上式得到u=3×10-8。3.15一种新的血栓溶解药t-pA,据说它能消除心脏病发作。在一次检测中的7名检测对象,年龄都在50岁以上,并有心脏病发作史。他们以这种新药治疗后,6人的血栓得到溶解,1人血栓没有溶解。假设t-pA溶解血栓是无效的,并假设,不用药物在短时间内心脏患者血栓自己溶解的概率φ是很小的,如φ=0.1。设y为7名心脏患者中血栓在短时间内可以自动溶解的患者数。问:〔1〕假设药物是无效的,7名心脏患者中的6名血栓自动溶解的概率是多少〔2〕Y≥6是否为一稀有事件,你认为药物是否有效答:〔1〕ф=0.11-ф=0.9n=7y=6,〔2〕P(Y≥6)=0.0000063+0.0000001=6.4×10-6。结论:在不用药的情况下,7名病人中6名患者的血栓自动溶解的事件是一个小概率事件,因此药物有效。3.16一农药商声称,用他的农药喷洒玉米后,90%的玉米植株中不再有活的玉米螟。为了验证这种说法,喷药后随机抽出25株玉米,发现7株中仍有活的玉米螟。〔1〕假设农药商的说法是正确的,在25株玉米中包含7株和7株以上有活玉米螟的概率是多少〔2〕在25株玉米中有7株有活玉米螟,你是否认为农药有效率达不到90%答:〔1〕〔2〕是3.17设计一实验用来检验号满意灵感应者是否有特异功能(ESP)。将5张卡片洗匀随机抽出一张,不准心灵感应者看,让他判断是哪一张。实验共重复20次,记录正确判断次数〔假设20次重复间是随机的〕。假设心灵感应者是猜的,没有ESP,那么〔1〕每次得到正确结果的概率是什么〔2〕在20次重复中,期望正确判断数是多少〔3〕正确判断6次和6次上的概率是多少〔4〕假设心灵感应者在20次重复中判断正确6次,是否可以证明心灵感应者不是猜的,而是真正的ESP答:〔1〕p=1/5。〔2〕E(Y)=np=20×1/5=4。〔3〕〔4〕不能。因为在猜想的情况下,20次重复中判断正确6次的概率为0.196,将近20%,已不是小概率事件,非心灵感应者有可能得到这样的结果。3.18据一个生化制药厂报告,在流水线上每8小时的一个班中,破碎的安瓿瓶数服从泊松分布,μ=1.5。问:〔1〕夜班破碎2个瓶子的概率是多少〔2〕在夜班打碎2个以下的概率是多少〔3〕在早班破碎2个以上的概率是多少〔4〕在一天连续三班都没有破碎的概率〔假设三班间是独立的〕答:〔1〕〔2〕〔3〕〔4〕记A为每个班没有破碎的事件,那么第五章统计推断5.1统计假设有哪几种它们的含义是什么答:有零假设和备择假设。零假设:假设抽出样本的那个总体之某个参数〔如平均数〕等于某一给定的值。备择假设:在拒绝零假设后可供选择的假设。5.2小概率原理的含义是什么它在统计假设检验中起什么作用答:小概率的事件,在一次试验中,几乎是不会发生的。假设根据一定的假设条件,计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,那么可以认为假设的条件不正确,从而否认假设。小概率原理是显著性检验的根基,或者说显著性检验是在小概率原理的根基上建设起来的。5.3什么情况下用双侧检验什么情况下可用单侧检验两种检验比较,哪一种检验的效率更高为什么答:以总体平均数为例,在μ不可能小于μ0时,那么备择假设为HA:μ>μ0,这时为上尾单侧检验。在μ不可能大于μ0时,那么备择假设为HA:μ<μ0,这时为下尾单侧检验。在没有关于μ不可能小于μ0或μ不可能大于μ0的任何信息的情况下,其备择假设为HA:μ≠μ0,这时为双侧检验。两种检验比较,单侧检验效率更高,因为在单侧检验时,有一侧的信息是的,信息量大于双侧检验,因此效率高于双侧检验。5.4显著性水平是一个指数还是一个特定的概率值它与小概率原理有什么关系常用的显著水平有哪几个答:显著性水平是一个特定的概率值。在小概率原理的表达中提到“假设根据一定的假设条件,计算出来该事件发生的概率很小〞,概率很小要有一个标准,这个标准就是显著水平。常用的显著水平有两个,5%和1%。5.5为什么会产生I型错误为什么会产生II型错误两者的关系是什么为了同时减少犯两种错误的概率,应采取什么措施答:在H0是真实的情况下,由于随机性,仍有一局部样本落在拒绝域内,这时将拒绝H0,但这样的拒绝是错误的。即,如果假设是正确的,却错误地据绝了它,这时所犯的错误称为I型错误。当μ≠μ0,而等于其它的值〔μ1〕时,样本也有可能落在承受域内。当事实上μ≠μ0,但错误地承受了μ=μ0的假设,这时所犯的错误称为II型错误。为了同时减少犯两种错误的概率,应当增加样本含量。5.6统计推断的结论是承受H0,承受零假设是不是说明零假设一定是正确的为什么“承受零假设〞的正确表述应当是什么答:统计推断是由样本统计量推断总体参数,推断的正确性是与样本的含量有关的。以对平均数的推断为例,当样本含量较少时,标准化的样本平均数u值较小,很容易落在承受域内,一旦落在承受域内,所得结论将是承受H0。如果抽出样本的总体参数μ确实不等于μ0,当增加样本含量之后,这种差异总能被检验出来。因此承受H0并不说明H0一定是正确的。承受H0的正确表述应当是:尚无足够的理由拒绝H0。尚无足够的理由拒绝H0并不等于承受H0。5.7配比照拟法与成组比较法有何不同在什么情况下使用配对法如果按成组法设计的实验,能不能把实验材料随机配对,而按配对法计算,为什么答:配比照拟法:将独立获得的假设干份实验材料各分成两局部或独立获得的假设干对遗传上基本同质的个体,分别承受两种不同的处理;或者同一个实验对象先后承受两种不同处理,比较不同的处理效应,这种安排称为配对实验设计。成组比较法:将独立获得的假设干实验材料随机分成两组,分别承受不同的处理,这种安排称为成组比较法。在生物统计学中,只有遗传背景一致的成对材料才能使用配比照拟法。如果按成组比较法设计的实验,不能把实验材料进展随机配对而按配对法计算。因为这种配对是无依据的,不同配对方式所得结果不同,其结果不能说明任何问题。5.8如果一个配对实验设计,在处理数据时使用了成组法计算,后果是什么答:对于一个配对设计,在处理数据时按成组法计算,虽然不能认为是处理错误,但会明显降低处理的敏感性,降低了检验的效率。5.9我国14岁的女学生,平均体重为43.38kg。从该年龄的女学生中抽取10名运发动,其体重(kg)分别为:39、36、43、43、40、46、45、45、42、41。问这些运发动的平均体重与14岁的女学生平均体重差异是否显著答:H0:μ=μ0〔43.38kg〕HA:μ≠μ0正态性检验:从正态概率图看,抽出样本的总体近似服从正态分布。SAS程序为:optionslinesize=76nodate;datagirl;inputweight@@;diff=weight-43.38;cards;39364343404645454241;run;procmeansntprt;vardiff;title'T-TestforSingleMean';run;结果见下表:T-TestforSingleMeanAnalysisVariable:DIFFNTProb>|T|--------------------------10-1.41172830.1917--------------------------P>0.05,尚无足够的理由拒绝H0。5.10以每天每千克体重52mol5-羟色胺处理家兔14天后,对血液中血清素含量的影响如下表[9]:/〔g·L-1〕s/〔g·L-1〕n对照组4.201.21125-羟色胺处理组8.491.119检验5-羟色胺对血液中血清素含量的影响是否显著答:首先,假定总体近似服从正态分布〔文献中没有给出〕。方差齐性检验的统计假设为:根据题意,此题之平均数差的显著性检验是双侧检验,统计假设为:程序如下:optionsnodate;datacommon;inputn1m1s1n2m2s2;dfa=n1-1;dfb=n2-1;vara=s1**2;varb=s2**2;ifvara>varbthenF=vara/varb;elseF=varb/vara;ifvara>varbthenFutailp=1-probf(F,dfa,dfb);elseFutailp=1-probf(F,dfb,dfa);df=n1+n2-2;t=abs(m1-m2)/sqrt(((dfa*vara+dfb*varb)*(1/n1+1/n2))/df);utailp=1-probt(t,df);k=vara/n1/(vara/n1+varb/n2);df0=1/(k**2/dfa+(1-K)**2/dfb);t0=abs(m1-m2)/sqrt(vara/n1+varb/n2);utailp0=1-probt(t0,df0);f=f;Futailp=Futailp;df=df;t=t;tutailp=utailp;output;df=df0;t=t0;tutailp=utailp0;output;cards;124.201.2198.491.11;procprint;idf;varFutailptdftutailp;title'T-TestforNon-PrimalData';run;结果如下:T-TestforNon-PrimalDataFFUTAILPTDFTUTAILP1.188300.413208.3227719.00004.6339E-81.188300.413208.4311018.13695.4346E-8首先看F检验,方差齐性检验是双侧检验,当显著性概率P<0.025时拒绝H0,在这里P=0.41,因此方差具齐性。方差具齐性时的t检验,看第一行的结果,其上侧尾区的显著性概率P是一个非常小的值,远远小于0.005。因此拒绝H0,5-羟色胺对血液中血清素的含量有极显著的影响。5.11以每天每千克体重52mol5-羟色胺处理家兔14天后,体重变化如下表[9]:/kgs/kgn对照组0.260.22205-羟色胺处理组0.210.1820检验5-羟色胺对动物体重的影响是否显著答:首先,假定总体近似服从正态分布〔文献中没有给出〕。方差齐性检验的统计假设为:根据题意,本例平均数差的显著性检验是双侧检验,统计假设为:程序不再给出,结果如下:T-TestforNon-PrimalDataFFUTAILPTDFTUTAILP1.493830.194770.7866538.00000.218181.493830.194770.7866536.56620.21828方差齐性检验:P>0.025,方差具齐性。t检验:上侧尾区显著性概率P>0.025,因此,尚无足够的理由拒绝H0,5-羟色胺对动物体重的影响不显著。5.1218岁汉族男青年与18岁维族男青年50米跑成绩〔s〕如下表[10]:汉族:n=150=7.48s=0.48维族:n=100=7.41s=0.69问:〔1〕检验两者平均成绩差异是否显著〔2〕检验两个民族个体间成绩的整齐程度差异是否显著答:首先,假定总体近似服从正态分布〔文献中没有给出〕,那么方差齐性检验的统计假设为:根据题意,本例平均数差的显著性检验是双侧检验,统计假设为:结果如下:T-TestforNon-PrimalDataFFUTAILPTDFTUTAILP2.06641.0000294980.94606248.0000.172522.06641.0000294980.88213161.9810.18951从结果中可以看出:〔1〕方差齐性检验说明,两者方差不具齐性。这也就答复了第二问,两个民族个体间成绩的整齐程度差异显著。〔2〕由于方差不具齐性,应看结果的第二行。检验统计量t的显著性概率P=0.18951,P>0.025,结论是汉族和维族18岁男青年50米跑平均成绩差异不显著。5.13一种内生真菌(Piriformosporaindica)侵染大麦后,可以提高其产量。为此,做了以下试验对该假设进展检验,所得结果如下表[11]:/〔g·pot-1〕s/〔g·pot-1〕n侵染组59.91.736未侵染组53.93.616检验侵染组与未侵染组的产量差异是否显著?答:首先,假定总体近似服从正态分布〔文献中没有给出〕,那么方差齐性检验的统计假设为:根据题意,本例平均数差的显著性检验是双侧检验,统计假设为:结果如下:T-TestforNon-PrimalDataFFUTAILPTDFTUTAILP4.354340.0661153.6713710.0000.00215374.354340.0661153.671377.1815.0038003统计量F的显著性概率P=0.066115,P>0.025,结论是方差具齐性。在方差具齐性时,t检验使用第一行的结果。统计量t的显著性概率P=0.0021537,P<0.005。因此,侵染组与未侵染组的产量差异极显著。5.14在一项关于乳房X线照片计算机协助诊断〔computer-aideddiagnosis,CAD〕的研究中,得到下表中的结果[12]:由10名放射学医生对乳房X线照片采用三种读片方式所得到的的值医生编号独立阅读不用CAD连续阅读借助CAD连续阅读10.130.220.6320.410.350.5230.170.300.3040.460.450.7350.200.240.4860.480.220.3170.520.430.5680.540.490.4690.150.060.18100.220.170.21这是一项配对设计,在三种读片方式中两两比较它们的差异显著性。答:〔1〕独立阅读与不用CAD连续阅读间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论