版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章统计数据的收集与整理1.1算术平均数是怎样计算的?为什么要计算平均数?答:算数平均数由下式计算:,含义为将全部观测值相加再被观测值的个数除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点,或是说是样本数据的代表。1.2既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差?答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。1.3标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同?答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。1.4完整地描述一组数据需要哪几个特征数?答:平均数、标准差、偏斜度和峭度。1.5下表是我国青年男子体重(kg)。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。666964656466686562646961616866576669666570645867666667666662666664626265646566726066656161666762656561646264656265686865676862637065646562666263686568576766686364666864636064696566676767656767666864675966656356666363666763706770626472696767666864657161636164646769706664656463706462697068656365666468696563676370656867696665676674646965646565686765656667726567626771696565756269686865636666656261686564676664606168676359656064636962716960635967616869666469656867646466697368606063386267656569656765726667646164666363666666636563676866626361666163686566696466706970636465646767656662616565606365626664答:首先建立一个外部数据文件,名称和路径为:。所用的SAS程序和计算结果如下:procformat;valuehfmt56-57='56-57'58-59='58-59'60-61='60-61'62-63='62-63'64-65='64-65'66-67='66-67'68-69='68-69'70-71='70-71'72-73='72-73'74-75='74-75';run;dataweight;infile'E:\data\exer1-5e.dat';inputbw@@;run;procfreq;tablebw;formatbwhfmt.;run;TheSASSystemCumulativeCumulativeBWFrequencyPercentFrequencyPercent-----------------------------------------------------1.6将上述我国男青年体重看作一个有限总体,用随机数字表从该总体中随机抽出含量为10的两个样本,分别计算它们的平均数和标准差并进行比较。它们的平均数相等吗?标准差相等吗?能够解释为什么吗?答:用means过程计算,两个样本分别称为和,结果见下表:TheSASSystemVariableNMeanStdDev----------------------------------------039660----------------------------------------随机抽出的两个样本,它们的平均数和标准差都不相等。因为样本平均数和标准差都是统计量,统计量有自己的分布,很难得到平均数和标准差都相等的两个样本。1.7从一个有限总体中采用非放回式抽样,所得到的样本是简单的随机样本吗?为什么?本课程要求的样本都是随机样本,应当采用哪种抽样方法,才能获得一随机样本?答:不是简单的随机样本。从一个有限总体中以非放回式抽样方法抽样,在前后两次抽样之间不是相互独立的,后一次的抽样结果与前一次抽样的结果有关联,因此不是随机样本。应采用随机抽样的方法抽取样本,具体说应当采用放回式抽样。1.8证明若用或编码时,前式是否仍然相等?答:(1)令则平均数特性之③。(2)令则平均数特性之②。用第二种编码方式编码结果,两式不再相等。1.9有一个样本:,设B为其中任意一个数值。证明只有当最小。这是平均数的一个重要特性,在后面讲到一元线型回归时还会用到该特性。答:令,为求使p达最小之B,令则。1.10检测菌肥的功效,在施有菌肥的土壤中种植小麦,成苗后测量苗高,共100株,数据如下[1]:编制苗高的频数分布表,绘制频数分布图,并计算出该样本的四个特征数。答:首先建立一个外部数据文件,名称和路径为:。SAS程序及结果如下:optionsnodate;procformat;valuehfmt-='3.5-4.4'-='4.5-5.4'-='5.5-6.4'-='6.5-7.4'-='7.5-8.4'-='8.5-9.4'-='9.5-10.4'-='10.5-11.4';run;datawheat;infile'E:\data\exr1-10e.dat';inputheight@@;run;procfreq;tableheight;formatheighthfmt.;run;proccapabilitygraphicsnoprint;varheight;histogram/vscale=count;insetmeanvarskewnesskurtosis;run;TheSASSystemTheFREQProcedureCumulativeCumulativeheightFrequencyPercentFrequencyPercent---------------------------------------------------------------------1.11北太平洋宽吻海豚羟丁酸脱氢酶(HDBH)数据的接收范围频数表[2]如下:(略作调整)HDBH数据的接收范围/(U·L-1)频数<2141<245.90913<277.818211<309.727319<341.636426<373.545522<405.454511<437.363613<469.27276<501.18183<533.09092根据上表中的数据作出直方图。答:以表中第一列所给出的数值为组界,直方图如下:1.12灵长类手掌和脚掌可以握物一侧的皮肤表面都有突起的皮肤纹嵴。纹嵴有许多特征,这些特征在胚胎形成之后是终生不变的。人类手指尖的纹型,大致可以分为弓、箕和斗三种类型。在手指第一节的基部可以找到一个点,从该点纹嵴向三个方向辐射,这个点称为三叉点。弓形纹没有三叉点,箕形纹有一个三叉点,斗形纹有两个三叉点,记录从三叉点到箕或斗中心的纹嵴数目称为纹嵴数(fingerridgecount,FRC)。将双手十个指尖的全部箕形纹的纹嵴数和/或斗形纹两个纹嵴数中较大者相加,称为总纹嵴数(totalfingerridgecount,TFRC)。下表给出了大理白族人群总纹嵴数的频数分布[3]:TFRC分组中值频数11~3020231~5040151~7060871~90802991~110100541111501406815119018018191~2102006首先判断数据的类型,然后绘出样本频数分布图,计算样本的四个特征数并描述样本分布形态。答:总纹脊数属计数数据。计数数据的频数分布图为柱状图,频数分布图如下:样本特征数(以TFRC的中值计算)SAS程序:optionsnodate;datatfrc;doi=1to10;inputy@@;inputn@@;doj=1ton;output;end;end;cards;202401608802910054120631406816051180182006;run;procmeansmeanstdskewnesskurtosis;vary;run;结果见下表:TheSASSystemAnalysisVariable:YMeanStdDevSkewnessKurtosis------------------------------------------------------126------------------------------------------------------从频数分布图可以看出,该分布的众数在第七组,即总纹脊数的中值为140的那一组。分布不对称,平均数略小于众数,有些负偏。偏斜度为,偏斜的程度不是很明显,基本上还可以认为是对称的,峭度几乎为零。1.13海南粗榧叶长度的频数分布[4]:叶长度/mm中值频数390143426433546569251874333276716771137nag667346181绘出频数分布图,并计算偏斜度和峭度。答:表中第一列所给出的数值为组限,下图为海南粗榧叶长度的频数分布图。计算偏斜度和峭度的SAS程序和计算结果如下:optionsnodate;datalength;doi=1to13;inputy@@;inputn@@;doj=1ton;output;end;end;cards;2.13902.314342.526432.735462.956923.151873.343333.527673.716773.911374.16674.33464.5181;run;procmeansnskewnesskurtosis;vary;run;TheSASSystemAnalysisVariable:YnSkewnessKurtosis------------------------------------------------------------------样本含量n=30000,是一个很大的样本,样本的偏斜度和峭度都已经很可靠了。偏斜度为,有一个明显的正偏。1.14马边河贝氏高原鳅繁殖群体体重分布如下[5]:体质量/g中值雌鱼雄鱼146713113025252516232117181612432首先判断数据的类型,然后分别绘制雌鱼和雄鱼的频数分布图,计算样本平均数、标准差、偏斜度和峭度并比较两者的变异程度。答:鱼的体重为度量数据,表中第一列所给出的数值为组限。在下面的分布图中雌鱼和雄鱼的分布绘在了同一张图上,以不同的颜色表示。计算统计量的SAS程序与前面的例题类似,这里不再给出,只给出结果。雌鱼:TheSASSystemAnalysisVariable:YNMeanStdDevSkewnessKurtosis----------------------------------------------------------------------------------------------------------------------雄鱼:TheSASSystemAnalysisVariable:YNMeanStdDevSkewnessKurtosis----------------------------------------------------------------------------------------------------------------------直观地看,雄鱼的平均体重低于雌鱼。雌鱼有一正偏,雄鱼有一负偏。因此,相对来说雌鱼低体重者较多,雄鱼高体重者较多。但两者都有很明显的负峭度,说明“曲线”较平坦,两尾翘得较高。1.15黄胸鼠体重的频数分布[6]:组界/g频数0<≤151015<≤302630<≤453045<≤602260<≤752275<≤901790<≤10516105<≤12014120<≤1356135<≤1504150<≤1652总数169绘制频数分布图,从图形上看分布是对称的吗,说明什么问题?答:下面是频数分布图:从上图可见,图形不是对称的,有一些正偏。说明在该黄雄鼠群体中,低体重者分布数量,高于高体重者的数量。另外,似乎峭度也有些低。1.1625名患者入院后最初的白细胞数量(×103)[7]如下表:851241168771273111411966561014455计算白细胞数量的平均数、方差和标准差。答:用means过程计算,程序不再给出,只给出运行结果。TheSASSystemAnalysisVariable:YNMeanVarianceStdDev---------------------------------------------------------------------------------------1.17细胞珠蛋白基因(CYGB)可能是非小细胞肺癌(NSCLC)的抑制基因之一。一个研究小组研究了该基因的表达、启动子甲基化和等位基因不平衡状态等,以便发现它与肿瘤发病间的关联。下面列出了其中15名患者的基因表达(肿瘤患者/正常对照,T/N),肿瘤患者与正常对照甲基化指数差(MtIT-MtIN)[8]:样本号T/NMtIT-MtIN357370367316369358303314308310341348323360336计算以上两项指标的平均数和标准差并计算两者的变异系数,这两个变异系数可以比较吗?为什么?答:记T/N为,MtIT-MtIN为,用means过程计算,SAS运行的结果见下表:TheSASSystemVariableNMeanStdDevCV------------------------------------------------------------------------------------------------------------两个变异系数是可以比较的,因为它们的标准差都是用平均数标准化了的,已经不存在不同单位的影响了。下面是赠送的中秋节演讲辞,不需要的朋友可以下载后编辑删除!!!谢谢中秋佳节演讲词推荐中秋,怀一颗感恩之心》老师们,同学们:秋浓了,月圆了,又一个中秋要到了!本周日,农历的八月十五,我国的传统节日——中秋节。中秋节,处在一年秋季的中期,所以称为“中秋”,它仅仅次于春节,是我国的第二大传统节日。中秋的月最圆,中秋的月最明,中秋的月最美,所以又被称为“团圆节”。金桂飘香,花好月圆,在这美好的节日里,人们赏月、吃月饼、走亲访友……无论什么形式,都寄托着人们对生活的无限热爱和对美好生活的向往。中秋是中华瑰宝之一,有着深厚的文化底蕴。中国人特别讲究亲情,特别珍视团圆,中秋节尤为甚。中秋,是一个飘溢亲情的节日;中秋,是一个弥漫团圆的时节。这个时节,感受亲情、释放亲情、增进亲情;这个时节,盼望团圆、追求团圆、享受团圆……这些,都已成为人们生活的主旋律。同学们,一定能背诵出许多关于中秋的千古佳句,比如“举头望明月,低头思故乡”、“但愿人长久,千里共婵娟”、“海上生明月,天涯共此时”……这些佳句之所以能穿透历史的时空流传至今,不正是因为我们人类有着的共同信念吗。中秋最美是亲情。一家人团聚在一起,讲不完的话,叙不完的情,诉说着人们同一个心声:亲情是黑暗中的灯塔,是荒漠中的甘泉,是雨后的彩虹……中秋最美是思念。月亮最美,美不过思念;月亮最高,高不过想念。中秋圆月会把我们的目光和思念传递给我们想念的人和我们牵挂的人,祝他们没有忧愁,永远幸福,没有烦恼,永远快乐!一、活动主题:游名校、赏名花,促交流,增感情二、活动背景:又到了阳春三月,阳光明媚,微风吹拂,正是踏青春游的好时节。借春天万物复苏之际,我们全班聚集在一起,彼此多一点接触,多一点沟通,共话美好未来,与此同时,也可以缓解一下紧张的学习压力。相信在这次春游活动中,我们也能更亲近的接触自然,感悟自然,同时吸收万物之灵气的同时感受名校的人文气息。
三、活动目的:1.丰富同学们的校园生活,陶冶情操。2.领略优美自然风光,促进全班同学的交流,营造和谐融洽的集体氛围。3.为全体同学营造一种轻松自由的气氛,又可以加强同学们的团队意识。4.有效的利用活动的过程及其形式,让大家感受到我们班级的发展和进步。四、活动时间:XX年3月27日星期四五、活动参与对象:房产Q1141全体及“家属”六、活动地点:武汉市华中农业大学校内七、活动流程策划:1、27日8点在校训时集合,乘车2、9点前往华农油菜基地、果园,赏花摄
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 厂内电力维修合同模板
- 北京公司注销合同范例
- 债款回购合同范例
- 2024年国际 container 物流运输合同
- 2024年度网络安全监控防护服务合同
- 企业转移员工劳动合同模板
- 伙合合同范例
- 二手空调租赁合同范例
- 书店生意转让合同模板
- 住建部公租房建设合同范例
- 阅读指导《我爸爸》导读课件
- 保安部岗位设置图
- DB31T 1295-2021 立体花坛技术规程
- 部编版《道德与法治》五年级上册第10课《传统美德 源远流长》优质课件
- 消防工程施工验收单样板
- 中央空调人员培训内容表
- 发现生活中的美-完整版PPT
- 小学道德与法治人教三年级上册第三单元安全护我成长-《遭遇陌生人》教案
- CAMDS操作方法及使用技巧
- 平狄克《微观经济学》(第8版)笔记和课后习题详解
- 最优化理论与算法课程教学大纲
评论
0/150
提交评论