版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章统计学及基本概念 3第二章数据的收集与整理 10第三章统计表与统计图 19第四章数据的描述性分析 25第五章参数估计 37第六章假设检验 49第七章方差分析 62第八章非参数检验 70第九章相关与回归分析 78第十章多元统计分析 89第十一章时间序列分析 101第十二章指数 108第十二章指数 108第十三章统计决策 120第十四章统计质量管理 128第一章统计学及基本概念1.1统计的涵义(统计工作、统计资料和统计学)1.2统计学的内容(统计学分类:理论统计学和应用统计学;描述统计学与推断统计学)1.3统计学的发展史(学派与主要代表人物)1.4数据类型(定类、定序、定距和定比;时间序列、截面数据和面板数据;绝对数、相对数、平均数)1.5变量:连续与离散;确定与随机1.6总体、样本与个体1.7标志、指标及指标体系1.8统计计算工具习题一、单项选择题1.推断统计学研究()。(知识点:1.2答案:D)A.统计数据收集的方法 B.数据加工处理的方法C.统计数据显示的方法 D.如何根据样本数据去推断总体数量特征的方法2.在统计史上被认为有统计学之名而无统计学之实的学派是()。(知识点:1.3答案:D)A.数理统计学派B.政治算术学派C.社会统计学派D.国势学派3.下列数据中哪个是定比尺度衡量的数据()。(知识点:1.4答案:B)A.性别B.年龄C.籍贯D.民族4.统计对现象总体数量特征的认识是()。(知识点:1.6答案:C)A.从定性到定量 B.从定量到定性 C.从个体到总体 D.从总体到个体5.调查10个企业职工的工资水平情况,则统计总体是()。(知识点:1.6答案:C)A.10个企业 B.10个企业职工的全部工资C.10个企业的全部职工D.10个企业每个职工的工资6.从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体是().(知识点:1.6答案:A)A.样本 B.总体单位 C.个体 D.全及总体7.三名学生期末统计学考试成绩分别为80分、85分和92分,这三个数字是()。(知识点:1.7答案:D)A.指标 B.标志 C.变量 D.标志值8.以一、二、三等品来衡量产品质地的优劣,那么该产品等级是()。(知识点:1.7答案:A)A.品质标志 B.数量标志 C.质量指标 D.数量指标9.()表示事物的质的特征,是不能以数值表示的。(知识点:1.7答案:A)A.品质标志 B.数量标志 C.质量指标 D.数量指标10.在出勤率、废品量、劳动生产率、商品流通费用额和人均粮食生产量五个指标中,属于数量指标的有几个()。(知识点:1.7答案:B)A.一个 B.二个 C.三个 D.四个二、多项选择题1.“统计”一词通常的涵义是指()。(知识点1.1答案:ABC)A.统计学B.统计工作C.统计资料D.统计局E.统计核算体系2、描述统计内容包括()()()()()。(知识点1.2答案:ABCD)A.统计数据收集方法B.数据加工处理方法C.统计数据显示方法D.数据分布特征的概括E.抽样推断方法3.根据统计分析方法的研究和应用来分,可将统计学分为()()()()()。(知识点1.2答案:AC)A.应用统计学 B.推断统计学 C.理论统计学D.描述统计学 E.统计数学4.下列属于应用统计学范畴的是()()()()()。(知识点1.2答案:ABCDE)A.生物统计学 B.农业统计学 C.卫生统计学D.社会统计学 E.人口统计学5.政治算术学派的创始人有()()()()()。(知识点1.3答案:CE)A.阿亨瓦尔 B.凯特勤 C.威廉·配第 D.恩格尔 E.约翰·格朗特6.下列各项中,()()()()()是相对数。(知识点1.4答案:BCDE)A.商品销售额 B.人口密度 C.学生出勤率 D.人均产量 E.平均工资7.下列各项中,()()()()()是连续型变量。(知识点1.5答案:BD)A.汽车产量 B.钢铁产量 C.图书馆藏书 D.图书馆面积 E.公交站点数8.统计指标的特点是()()()()()。(知识点1.7答案:ACE)A.可量性 B.大量性 C.综合性 D.差异性 E.具体性9.著名的统计分析软件有()()()()()。(知识点1.8答案:ACD)A.SAS B.SNA C.SPSS D.STATISTICA E.ERP10.Excel实现统计分析的主要途径是()()()()()。(知识点1.8答案:ABE)A.公式 B.函数 C.过程D.方程 E.数据分析工具
第二章数据的收集与整理2.1数据的来源2.2统计调查方案设计2.3调查方法2.4调查的组织方式:普查、抽样调查、重点调查、典型调查2.5抽样的组织方式:简单随机抽样、系统抽样、分层抽样、整群抽样2.6数据的审定:误差2.7数据的分组2.8.编制次数分布表:频数(次数)、频率习题一、单项选择题1.小吴为写毕业论文去收集数据资料,()是次级数据。(知识点:2.1答案:C)A.班组的原始记录B.车间的台帐C.统计局网站上的序列D.调查问卷上的答案2.人口普查规定标准时间是为了()。(知识点:2.2答案:A)A.避免登记的重复与遗漏 B.将来资料具有可比性C.确定调查单位D.登记的方便3.要了解某商场电视机的库存情况,宜采用()。(知识点:2.3答案:A)A.现场观察法 B.实验采集法C.问卷法D.访谈法4.检查产品寿命应采用()。(知识点:2.4答案:B)A.普查B.抽样调查C.重点调查D.典型调查5.为掌握商品销售情况,对占该市商品销售额80%的五个大商场进行调查,这种调查方式属于()。(知识点:2.4答案:B)A.普查 B.重点调查C.抽样调查D.统计报表6.将总体中的各单位按某一标志排列,再依固定间隔抽选调查单位的抽样方式为()。(知识点:2.5答案:D)A.分层抽样 B.简单随机抽样 C.整群抽样 D.等距抽样7.整群抽样是对被抽中的群作全面调查,所以整群抽样是()。(知识点:2.5答案:B)A.全面调查 B.非全面调查 C.一次性调查D.经常性调查8.统计整理所涉及的资料()。(知识点:2.6答案:C)A.原始数据B.次级数据C.原始数据和次级数据D.统计分析后的数据9.在进行数据分组时,首先考虑的是()。(知识点:2.7答案:B)A.分成多少组 B.选择什么标志分组 C.各组差异大小D.分组后计算方便10.某连续变量数列末位组为开口组,下限为200,相邻组组中值为170,则末位组中值为()。(知识点:2.8答案:A)A.230 B.200 C.210 D.180二、多项选择题1.统计调查方案的主要内容是()()()()()。(知识点2.2答案:ABCDE)A.调查的目的B.调查对象C.调查单位D.调查时间E.调查项目2.全国工业普查中()()()()()。(知识点2.2答案:ABCE)A.所有工业企业是调查对象B.每一个工业企业是调查单位C.每一个工业企业是报告单位D.每个工业企业的总产值是统计指标E.全部国有工业企业数是统计指标3.普查是()()()()()。(知识点2.4答案:BCE)A.非全面调查B.专门调查C.全面调查D.经常性调查E.一次性调查4.全面调查形式有()()()()()。(知识点2.4答案:DE)A.重点调查B.抽样调查C.典型调查D.统计报表E.普查5.哪几种抽样方式可以通过提高样本的代表性而减小抽样误差?()()()()()。(知识点2.6答案:AD)A.分层抽样 B.简单随机抽样 C.整群抽样 D.等距抽样E.普查6.根据树苗高度的次数分布表,下面哪些说法是正确的?()()()()()。(知识点2.8答案:ACE)树苗高度x(厘米)频数f(棵)频率(%)向上累积向下累积频数(棵)频率(%)频数(棵)频率(%)80-9087.387.3110100.090-10098.21715.510292.7100-1102623.64339.19384.5110-1203027.37366.46760.9120-1301816.49182.73733.6130-1401210.910393.61917.3140-15054.510898.276.4150-16021.8110100.021.8合计110100————A.树苗高度低于110厘米的占总数的39.1% B.树苗高度低于110厘米的占总数的84.5%C.树苗高度高于130厘米的有19棵 D.树苗高度高于130厘米的有103棵E.树苗高度在130-140厘米之间的树苗占总数的10.9%
三、制表1.某高校二级学院60名教职员工的月岗位津贴资料如下:110012001200140015001500170017001700180018001900190021002100220022002200230023002300230024002400250025002500250026002600260027002700280028002800290029002900310031003200320033003300340034003500350036003600380038004200380036003500340031003100依据上述资料编制组距变量数列,并用次数分布表列出各组的频数和频率,以及向上、向下累积的频数和频率。(知识点2.8)2.根据数据集02中F列的“妇女期望寿命”编制次数分布表,列出各组的频数和频率,以及向上、向下累积的频数和频率。(知识点2.8)
第三章统计表与统计图3.1统计表的规范及其分类3.2制作透视表3.3汇总统计表3.4统计图的规范3.5如何用Excel做统计图习题一、单项选择题1.统计表的结构从形式上看包括()、横行标题、纵栏标题、数字资料四个部分。(知识点3.1答案:D)A.计量单位 B.附录 C.指标注释 D.总标题2.如果统计表中数据的单位都一致,我们可以把单位填写在()。(知识点3.1答案:C)A.左上角B.左下角 C.右上角 D.左下角3.现有某公司2007年各季度在各个地区销售各种产品的情况,数据库的四个字段是:地区、季度、商品、销售额。如果要反映各种商品在各地区和各季度的销售情况,应该绘制()。(知识点3.2答案:D)A.地区和商品的二维透视图 B.季度和商品的二维透视图C.地区、季度和销售额的三维透视图 D.地区、季度和商品的三维透视图4.用Excel汇总第二季度中三个月份的资料,用()功能。(知识点3.3答案:B)A.透视表B.合并计算 C.单变量求解 D.分类汇总5.小张收集了1957-2007年中国GDP的数据,如果要反映这50年我国生产发展的趋势,用什么图形最为合适?()(知识点3.5答案:D)A.直方图B.散点图C.饼图D.折线图6.小钱收集了上海、江苏和浙江三省2007年三次产业的增加值的资料,如果要反映2007年这三个省三次产业的结构,用什么图形最为合适?()(知识点3.5答案:C)A.直方图B.散点图C.饼图D.折线图二、多项选择题1.统计表可以分为()()()()()。(知识点3.1答案:ACE)A.简单表B.复杂表C.简单分组表 D.复杂分组表 E.复合分组表2.完整的统计图应包括()()()()()。(知识点3.4答案:ABCDE)A.标题 B.坐标轴和网格线C.图表区 D.绘图区 E.图例3.下面这张表的资料用什么图形表现比较合适?()()()()()。(知识点3.5答案:CD)A.直方图B.散点图C.饼图D.折线图E.茎叶图某地区税收收入构成表税收类型数额(万元)销售税2812000所得税2790000执照税185000营业税535000其他税378004.统计局住户处收集了3000户居民八月份消费的详细情况,如果要按月消费额的多少反映居民消费结构,用什么图形表现比较合适?()()()()()。(知识点3.5答案:ACDE)A.直方图B.散点图C.饼图D.折线图E.茎叶图三、制表、制图1.
根据数据集03,按“性别”和“教育程度”计算相应的平均工资。(知识点3.2)2.根据数据集03,按“教育程度”和“性别”计算2007年考核时各个档次的人数。(知识点3.2)3.根据王小毛、吴燕燕和朱青新三人的一年的销售记录,汇总出各种产品的销售量。(知识点3.3)4.根据数据集01中C列的“国内生产总值”指标,绘制1952-2006年GDP的趋势图。(知识点3.5)5.仿照例题3.3,根据数据集01中的相关资料,编制1953、1963、1973、1983和1993年的饼图,比较这六年产业结构的变化状态,并根据这六年的资料绘制三维百分比堆积柱形图。(知识点3.5)
第四章数据的描述性分析4.1.数值平均数4.2.位置平均数4.3.离散程度4.4.方差分解4.5.数据的标准化4.6.分布性质(偏度、峰度)4.7.指标计算(函数、数据分析工具)习题一、单项选择题1.加权算术平均数中的权数为()。(知识点4.1,答案:D)A.变量值B.次数的总和C.变量值的总和D.次数比重2.某车间三个班生产同种产品,6月份劳动生产率分别为2、3、4(件/工日),产量分别为400、500、600件,则该车间平均劳动生产率计算式应为()。(知识点4.1,答案:D)A.B.C.D.3.受极端数值影响较小的集中趋势值是。(知识点4.2,答案:B)A.算术平均数B.众数和中位数C.几何平均数D.调和平均数4.某公司2006年管理人员年均收入35000元,生产人员为25000元;2007年各类人员年均收入水平不变,但管理人员增加15%,生产人员增加25%,则两类人员平均的年收入2007年比2006年()。(知识点4.1,答案:B)A.提高B.下降C.持平D.无法判断5.离散程度测度值中,由最大变量值和最小变量值之差决定的是()。(知识点4.3,答案:D)A.方差B.标准差C.平均差D.极差6.标准差系数抽象了()。(知识点4.3,答案:B)A.总体单位数多少的影响B.算术平均数高低的影响C.总体指标数值大小的影响D.标志变异程度的影响7.在一个单项分配数列中,若各组变量值都减少一半,每组次数增加1倍,中位数()。(知识点4.2,答案:A)A.减少一半B.增加1倍C.增加2倍D.不变8.离散程度的测度值愈大,则()。(知识点4.3,答案:A)A.反映变量值愈分散,算术平均数代表性愈差B.反映变量值愈集中,算术平均数代表性愈差C.反映变量值愈分散,算术平均数代表性愈好D.反映变量值愈集中,算术平均数代表性愈好9.甲数列的算术平均数为100,标准差为10;乙数列的算术平均数为20,标准差为3,故()。(知识点4.3,答案:C)A.两数列算术平均数的代表性相同 B.乙数列算术平均数的代表性好于甲数列C.甲数列算术平均数的代表性好于乙数列 D.两数列算术平均数的代表性无法比较10.如果某个分布是极度右偏,则其偏度系数为()。(知识点4.6,答案:D)A.-0.3B.0.3C.-2.9D.2.911.已知总方差为1000,组内方差的平均数为600,组间方差为()。(知识点4.4,答案:A)A.400B.500C.600D.160012.如果某同学在英语竞赛中的标准得分为2,并且知道1%为一等奖,5%为二等奖,10%为三等奖,则他()。(知识点4.5,答案:D)A.获一等奖B.获二等奖C.获三等奖D.无缘奖项二、多项选择题1.加权算术平均数的大小受下列因素的影响()()()()()。(知识点4.1,答案:ABE)A.各组变量值大小的影响B.各组频数多少的影响C.与各组变量值大小无关D.与各组频数多少无关E.各组变量值和频数共同影响2.下列现象应采用调和平均数计算的有()()()()()。(知识点4.1,答案:ABD)A.已知各组工人月工资和相应的工资总额,求平均工资B.已知某企业各车间废品率和废品量,求平均废品率C.已知各车间计划完成百分比和计划产量,求平均计划完成百分比D.已知各车间工人劳动生产率和产品产量,求平均工人劳动生产率E.已知某企业各产品的产量和单位成本,求平均单位成本3.比较两组工作成绩:算术平均数甲组小于乙组,标准差甲组大于乙组,则()()()()()。(知识点4.3,答案:ACE)A.乙组算术平均数代表性高于甲组B.甲组算术平均数代表性高于乙组C.乙组工作的均衡性好于甲组D.甲组工作的均衡性好于乙组E.甲组离散程度大于乙组4.将所有变量值都减去10,那么其()()()()()。(知识点4.3,答案:BCD)A.算术平均数不变B.算术平均数减去10C.方差不变D.标准差不变E.标准差系数不变5.将所有变量值都扩大10倍,那么其()()()()()。(知识点4.3,答案:BE)A.算术平均数不变B.算术平均数(扩大10倍)减去10C.方差不变D.标准差不变E.标准差系数不变6.如果某个分布是左偏,并且是尖峰,则()()()()()。(知识点4.6,答案:AE)A.=-2B.=-2C.=2D.=0E.=2三、计算题1.某班《统计学》成绩资料如下,计算平均成绩、标准差及标准差系数。统计学成绩(分)学生人数(人)40-5050-6060-7070-8080-9090-100578201462.某公司所属三个企业生产同种产品,2007年实际产量、计划完成情况及产品优质品率资料如下,要求计算:(1)该公司产量计划完成百分比;(2)该公司实际的优质品率。企业实际产量(万件)完成计划(%)实际优质品率(%)甲乙丙100150250120110809596983.两个菜场有关销售资料如下,试计算比较两个菜场价格的高低,并说明理由。蔬菜名称单价(元)销售额(元)甲菜场乙菜场ABC2.52.83.52200195015001650195030004.你是歌迷吗?是球迷吗?好!上互联网查找你喜欢的歌星、球星的收入情况,计算他们的平均收入和收入的标准差,再与例4.17中的数据比较,看能得出什么结论。5.你知道什么是“CEO”和“CIO”吗?想办法收集这两类人的收入情况,计算他们的平均收入和收入的标准差,再与例4.17中的数据比较,看能得出什么结论。6.在Excel中有一个函数叫“TRIMMEAN”,想办法找到这个函数的背景资料,说明这个平均数的一般中文译名,并举例说明这个指标的计算。四、操作题1.打开Ex4_1,其中有15个数据。要求:(1)计算这组数据的算术平均数、调和平均数和几何平均数,(2)比较三种平均数的大小;(3)将这组数据减少10、增加10,计算新生成的两组数列的算术平均数、标准差和标准差系数;(4)将这组数据乘以10、除以10,计算新生成的两组数列的算术平均数、标准差和标准差系数。2.打开Ex4_2,其中是经济学专业2个班级的微积分的期末考试成绩。要求:(1)计算这个专业微积分成绩的最高分、最低分、算术平均数和标准差(用工具“描述统计”);(2)分别计算这两个班级微积分成绩的最高分、最低分、算术平均数和标准差(用工具“描述统计”);(3)分别统计并做表列出两个班级各档分数的次数(用函数“Frequency”)与所占比重、列出向上、向下累计的次数与频率。3.打开Ex4_3,其中是2005年江苏省52个县市人均地区生产总值。计算各项指标,并选择答案:(1)江苏省52个县市的平均人均地区生产总值是多少元?A.20725B.18674C.15721D.19711E.85124(2)江苏省52个县市人均地区生产总值的标准差是多少?A.36023B.11969C.9837D.5632E.21773(3)江苏省52个县市人均地区生产总值的中位数是多少?A.6923B.4292C.13119D.5798E.14992(4)江苏省52个县市人均地区生产总值的偏态系数是多少?A.0.55B.-1.23C.2.56D.2.48E.-0.10(5)江苏省52个县市人均地区生产总值的峰度系数是多少?A.8.92B.-5.28C.2.02D.6.57E.-0.54(6)江苏省52个县市人均地区生产总值的全距是多少?A.10964B.108647C.108586D.32948E.25124(7)根据斯透奇斯规则对52个县市数据进行分组,组数是多少?A.9B.5C.7D.6E.8(8)若采用等距数列,根据组数和全距的关系,确定的组距是多少?A.18500B.16300C.29400D.17000E.23200(9)人均地区生产总值在20600~36900元之间的县市个数是多少?A.35B.8C.5D.6 E.20(10)人均地区生产总值大于20600元的县市个数占全部县市比例是多少?A.32.7%B.20.2%C.25.0% D.15.6%E.28.8%第五章参数估计5.1统计推断的基本问题、原理和概念(简单随机样本,抽样误差,统计量,估计量,估计值等)5.2参数点估计的常见方法(矩估计,极大似然估计)5.3参数点估计的评价标准(无偏性,一致性,有效性)5.4正态总体均值的区间估计(单个正态总体,两个正态总体,双(单)侧置信区间)5.5总体成数的区间估计(单贝努里总体,两贝努里总体)5.6正态总体方差的区间估计(单正态总体,两正态总体)5.7参数估计所需的样本容量的确定(总体均值估计的必要样本容量,总体成数估计的样本容量)习题一、单项选择题1、以下关于统计量的说法正确是()。(知识点5.1答案:C)A.统计量的分布含有未知参数B.统计量中可以包含未知参数C.统计量是样本的函数,不能含有任何未知参数D.统计量是具体数据的函数2、计算总体均值或成数估计的必要样本容量时,若有多个样本标准差的资料,应选哪个来计算()。(知识点5.7答案:B)A.最小一个B.最大一个C.中间一个D.平均值3、抽样误差是指()。(知识点5.1答案:D)A.计算过程中产生的误差B.调查中产生的登记性误差C.调查中产生的系统性误差D.调查中产生的随机性误差4、比例(成数)和比例(成数)方差的关系是()。(知识点5.1答案:C)A.比例越接近于0,比例方差越大 B.比例越接近于1,比例方差越大C.比例越接近于0.5,比例方差越大 D.比例越接近于0.25,比例方差越大5、矩估计的基本原理是()。(知识点5.2答案:A)A.用样本矩估计总体矩B.使得似然函数达到最大C.使得似然函数达到最小D.小概率事件在一次试验中是不可能发生的6、抽样调查结果表明,甲企业职工平均工资方差为25,乙企业为100,又知抽取的乙企业工人数比甲企业工人数多3倍,则重复抽样时随机抽样误差()。(知识点5.1答案:C)A.乙企业较大B.甲企业较大C.相同D.不能作出结论二、多项选择题1、抽样调查中的抽样误差()。(知识点5.1答案:ACE)A.是不可避免要产生的B.是可以通过改进调查方法来避免的C.是可以计算出来的D.随着样本容量的增加而增大E.其大小是可以控制的2、评价点估计量的基本标准常见的有()。(知识点5.3答案:ABD)A.无偏性B.一致性C.可靠性D.有效性E.经济性3、参数估计所需的样本容量取决于()。(知识点5.7答案:ABDE)A.总体方差B.容许误差C.样本个数D.置信度E.抽样方法4、如果正态总体均值95%置信区间为(960,1040),则有()。(知识点5.4答案:BCE)A.样本容量为16B.能给出置信下限的单侧置信区间为(966.33,+∞)C.样本均值为1000D.样本方差是81.63E.容许误差是405、以下说法正确的是()。(知识点5.3答案:ABDE)A.样本均值是总体均值的无偏估计B.样本方差是正态总体方差的无偏估计C.是正态总体方差的无偏估计D.样本成数是总体成数的无偏估计E.在大量次抽样后,计算出的的算术平均数应接近于总体均值6、关于必要样本容量,正确是()。(知识点5.7答案:BCDE)A.在对总体均值作估计时采用重复抽样,若其他条件不变,容许误差Δ缩小一半,则必要样本容量必须为原来的1/4。B.在对总体均值作估计时采用重复抽样,若其他条件不变,容许误差Δ缩小一半,则必要样本容量必须为原来的4倍。C.在对总体均值作估计时采用重复抽样,若其他条件不变,容许误差扩大一倍,则必要样本容量必须为原来的1/4。D.在对总体均值作估计时,若其他条件不变,总体的方差越大,所需样本容量也大。E.在对总体均值作估计时,若其他条件不变,不重复抽样比重复抽样需要的样本容量要小。三、计算题1、某企业从长期实践得知,其产品直径X服从正态分布。从某日产品中随机抽取10个,测得其直径分别为14.8,15.3,15.1,15.0,14.7,15.1,15.6,15.3,15.5,15.1(单位:厘米)。在99%的置信度下,求该产品直径平均数的置信区间和给出置信上限的单侧置信区间。2、现从某公司职工中随机抽取60人调查其工资收入情况,得到有关资料在下表,假定职工的月收入服从正态分布;(1)以95%的置信度估计该公司工人的月平均工资所在范围;(2)以95.45%的置信度估计月收入在1000元及以上工人所占比重。月收入80090095010001050110012001500工人数6791098743、一农场种植葡萄以生产果冻,假设葡萄的甜度为,服从正态分布,从27卡车葡萄中,随机的抽取样本,每辆车取一个,然后测量甜度,结果如下:16.015.212.016.914.416.315.612.915.315.815.512.514.514.915.116.012.514.315.413.012.614.915.115.312.417.214.8(1)求葡萄平均甜度的95%置信区间和单侧置信区间。(2)分别求葡萄甜度方差和标准差的95%置信区间。4、和分别表示下肢瘫痪和正常成年男子的血液容量,单位ml,假设服从,服从。对做了7次观测,结果是1612,1352,1456,1222,1560,1456,1924,对做了10次观测,1082,1300,1092,1040,910,1248,1092,1040,1092,1288。求的95%置信区间。5、和分别表示A、B两种品牌的日光灯的寿命,分别服从和,从AB两个品牌的日光灯中分别随机地抽取了56和57个日光灯,测得平均寿命分别是937.4小时和988.9小时;求的99%置信区间。6、生物学家要比较某种蜘蛛的雌、雄蜘蛛的体长,以和分别表示雌、雄蜘蛛的的体长,和分别表示和的均值;研究者分别测量了30个雌、雄蜘蛛,数据如下。求的95%大样本置信区间。X:5.204.705.757.506.456.554.704.805.955.206.356.955.706.205.406.205.856.805.655.505.655.855.756.355.755.955.907.006.105.80Y:8.259.955.907.058.457.559.8010.856.607.558.109.106.109.308.757.007.808.009.006.308.358.708.007.509.508.307.058.307.959.607、X和Y分别表示某种录音唱片和高密磁碟的录音时间,假设服从,服从,现在从X和Y中分别随机抽取了9个和13个,测得录音时间如下X:40.8343.1835.7238.6837.1739.7524.7634.5833.98Y:42.8264.4256.9239.9272.3847.2664.58 38.2072.7539.0939.0733.7062.02求的95%置信区间。8、某企业对一批产品进行质量检验,这批产品的总数为5000件,过去几次同类调查所得的产品合格率为93%、95%和96%,为了使合格率的允许误差不超过3%,在99.73%的概率下应抽查多少件产品?9、在一项政治选举中,一位候选人在选民中随机地做了一次调查,结果是351名投票者中有185人支持他,求全部选民中支持他的选民所占比重的95%的近似置信区间。10、为测试两种洗涤剂清除某种类型的污渍的能力,检验人员用第一种洗涤剂做了91次独立试验,结果由63次成功清除该类污渍,用第二种洗涤剂做了79次试验有42次清除了污渍。计算两种洗涤剂清除该类污渍的成功次数之差的90%置信区间;根据你的计算结果,你能得到什么结论?哪种洗涤剂的去污能力更强?还是没有显著差别?11、某国以前的失业率大约是8%,政府在制定国家的经济政策时,要估计最新的失业率。决策者希望失业率的最新估计与真正的失业率相差不能超过1%,问要调查多少人的就业情况?(置信水平为98%)。12、检验某食品厂本月生产的10000袋产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45%的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?四、操作题某公司有职工8000人,从中随机抽取406人调查其每月工资收入状况的调查数据存放在Ex5_1数据库中。(1)计算被调查职工的月平均工资。A.2959.562B.2969.562C.2979.562D.2989.562(2)计算被调查职工的月工资收入的标准差。A.849.8272B.859.8272C.869.8272D.879.8272(3)月收入在2500元及以上职工人数。(1分)A.256B.257C.258D.259(4)试以95.45%的置信水平推断该公司职工月平均工资所在的范围。(3分)A.2857.377-3081.746B.2867.377-3071.746C.2877.377-3061.746D.2887.377-3051.746(5)试以95.45%的置信水平推断月收入在2500元及以上职工在全部职工中所占的比重。(4分)A.56.89%-70.20%B.57.89%-69.20%C.58.89%-68.20%D.59.89%-67.20%答案:BACDC
第六章假设检验6.1假设检验的概念(与区间估计、非参数检验的区别)6.2假设检验的原假设与备择假设6.3假设检验中的两类错误6.4假设检验的结论判断(拒绝与接受)6.5总体均值的检验6.6总体成数的检验6.7总体方差的检验习题一、单项选择题1.对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程称为()。(知识点6.1答案:A)A.假设检验B.参数估计C.双边检验D.单边检验2.研究者想收集证据予以支持的假设通常称为()。(知识点6.2答案:A)A.原假设B.备择假设C.合理假设D.正常假设3.在假设检验中,原假设与备择假设()。(知识点6.2答案:C)A.都有可能被接受B.都有可能不被接受C.只有一个被接受而且必有一个被接受D.原假设一定被接受,备择假设不一定被接受4.在复合假设检验中,“=”一般放在()。(知识点6.2答案:A)A.原假设上B.备择假设上C.可以放在原假设上,也可以放在备择假设上D.有时放在原假设上,有时放在备择假设上5.在假设检验中,不能拒绝原假设意味着()。(知识点6.4答案:C)A.原假设肯定是正确的B.原假设肯定是错误的C.没有证据证明原假设是正确的D.没有证据证明原假设是错误的6.在假设检验中,通常犯第一类错误的概率称为()。(知识点6.3答案:B)A.置信水平B.显著性水平C.取伪概率D.取真概率7.拒绝域的大小与我们事先选定的()。(知识点6.4答案:D)A.统计量有一定关系B.临界值有一定关系C.置信水平有一定关系D.显著性水平有一定关系8.在假设检验中,如果样本容量一定,则第一类错误和第二类错误()。(知识点6.3答案:B)A.可以同时减小B.不能同时减小C.可以同时增大D.只能同时增大二、多项选择题1.假设检验和参数估计的联系与区别,下面五个判断正确的有()()()()()。(知识点6.1答案:ABC)A.都是对总体某一数量特征的推断,都是运用概率估计来得到自己的结论;B.前者则需要事先对总体参数做出某种假设,然后根据已知的抽样分布规律确定可以接受的临界值;C.后者无须事先对总体数量特征做出假设。它是根据已知的抽样分布规律找出恰当的区间,给出总体参数落在这一区间的概率。D.假设检验中的第二类错误就是参数估计中的第一类错误E.假设检验中实测显著性水平就是参数估计中的置信系数2.当我们根据样本资料对零假设做出接受或拒绝的决定时,可能出现的情况有()()()()()。(知识点6.3答案:ACDE)A.当零假设为真时接受它;B.当零假设为假时接受它,我们犯了第一类错误;C.当零假设为真时拒绝它,我们犯了第一类错误;D.当零假设为假时拒绝它;E.当零假设为假时接受它,我们犯了第二类错误3.假设检验拒绝原假设,说明()()()()()。(知识点6.4答案:CD)A.原假设有逻辑上的错误B.原假设根本不存在C.原假设成立的可能性很小D.备择假设成立的可能性很大E.备择假设成立的可能性很小4.在假设检验中,犯第一类错误的概率与犯第二类错误的概率的关系是()()()()()。(知识点6.3答案:DE)A.=B.与成正比例关系变化C.与成反比例关系变化D.当值给定后,值随之确定E.当值减小后,值会随之增大5.假设检验中,下面五个判断正确的有()()()()()。(知识点6.2答案:BCD)A.当零假设为假时接受它的概率就是备择假设为真时接受它的概率B.当零假设为假时接受它的概率就是备择假设为真时拒绝它的概率C.当零假设为真时接受它的概率就是备择假设为假时拒绝它的概率D.当零假设为真时拒绝它的概率就是备择假设为假时接受它的概率E.当备择假设为假时拒绝它的概率等于零假设为假时接受它的概率三、计算题1.设零件长度服从正态分布,要求其长度规格为3.278mm,今取该批零件中的10个,测得长度mm如下:3.281,3.276,3.278,3.286,3.279,3.278,3.281,3.279,3.280,3.277(1)当=0.002(mm)时,该批零件平均长度与原规格有无明显差异?(取0.05)(2)当未知时,又怎样呢?(取0.05)2.某厂生产一种新型家用产品,厂家声称某市已有20%以上的家庭在使用这种产品。市场调查人员在该市抽选了一个由300个家庭组成的随机样本,发现有70个家庭使用了这种产品。这些数据是否为证实厂家的说法提供了充分证据?(取0.05)3.对某建筑材料产品分别在100度和200度的条件下各做了8次试验,测得断裂力的数据(kg)如下:100度:20.5,18.8,19.8,20.9,21.5,19.5,21.0,21.2200度:17.7,20.3,20.0,18.8,19.0,20.1,20.2,19.1设断裂力服从正态分布,在水平下检验:(1)可否认为两种温度下的断裂力方差相等?(2)可否认为两种温度下的断裂力均值相等?4.某大学共有1000名四年级大学生,其中男生600名,女生400名。某位教师认为男生己通过计算机二级水平考试的成数要高于女生。为证实自己的看法,他分别随机抽选了60名男生和40名女生,发现已通过这种考试的人数分别为35人和17人。这些数据是否足以说明这位老师的看法正确(0.01)?5.有关人士想知道能否作出这样的结论:居民区1中的家庭每周看电视的平均小时数比居民区2中的家庭少。从80,60的两个独立随机样本得出的数据如下:19.5小时,23.7小时,12小时,16小时(取0.05)。6.根据数据集03按整理出256名男职工和214名女职工的受教育年限资料,问能否认为男职工的受教育年限比女职工的要高出2年或高出1年(取=0.05)?7.一个以减肥为主要目的的健美俱乐部声称,参加他们的训练至少可使肥胖者减少17斤,为了验证,调查人员随机抽取了10名参加者,得到他们的体重记录,在显著性水平为0.05的情况下,调查结果是否支持俱乐部的说法?训练前189202220207194177193202208233训练后170179203192172161174187186204(提示:可以用Excel中分析工具中的“t-检验:成对双样本均值分析”)四、计算题1.某教师去年所授4个班共207人的“统计学”课程平均成绩为82分。今年该教师进行了本课程较成功地教学改革,于是声称今年自己所授3个班共154人的该课程平均成绩将比去年高。现在要求你对该教师的声称进行假设检验(=0.05)。Ex6_1是今年该教师所授本课程3个班级中随机抽取的已批阅36份学生试卷(假设考试已结束)。(1)你所选取的原假设最好是()A.u≤82B.u≥82C.u<82D.u>82(2)你计算出的=()A.1.711563B.1.892153C.1.435912D.1.798658(3)你计算出的p—值=()A.0.050121B.0.041732C.0.040351D.0.042001(4)你得到的结论是()A.拒绝u≥82B.无理由拒绝u≤82C.拒绝u<82D.接受u>82(5)若选用=0.01,你得到的结论是()A.拒绝u≥82B.无理由拒绝u≤82C.拒绝u<82D.接受u>822.某教师今年“统计学”课程授课对象为经济学专业(代号1)158人和贸易经济专业(代号2)203人。从该课程期中考试情况看,学生均分前者高于后者2分。该教师声称,该课程期末考试成绩学生均分前者会高于后者。现在要求你对该教师的声称进行假设检验(=0.01)。Ex6_2存放着经济学专业和贸易经济专业学生期末考试成绩36个样本资料。假定两个专业学生考分的总体方差相等。(1)你所选取的原假设最好是()A.u1-u2≥0B.u1-u2>0C.u1-u2<0D.u1-u2≤0(2)你计算出的=()A.2.829439B.3.775602C.3.002037D.2.443848(3)你计算出的p-值=()A.0.008527B.0.001606C.0.006351D.0.003663(4)你得到的结论是()A.拒绝u1-u2≥0B.拒绝u1-u2≤0C.无理由拒绝u1-u2≤0D.无理由拒绝u1-u2<0(5)若选用=0.05,你得到的结论是()A.无理由拒绝u1-u2≤0B.接受u1-u2>0C.接受u1-u2≤0D.拒绝u1-u2≥0
第七章方差分析7.1.方差分析概念7.2.单因素分析7.3.多重比较检验7.4.双因素方差分析(无交互作用)7.5.双因素方差分析(有交互作用)习题一、单项选择题1.某饮料生产企业研制了一种新型饮料,饮料有五种颜色。如果要考察颜色是否会影响销售量,则水平为()。(知识点7.1,答案:D)A.2B.3C.4D.52.下列指标中包含有系统性误差的是()。(知识点7.2,答案:A)A.SSAB.SSEC.D.3.SST的自由度是()。(知识点7.2,答案:D)A.r-1B.n-rC.r-nD.n-14.单因素方差分析的备择假设应该是()。(知识点7.2,答案:B)A.B.不全相等C.全不相等D.5.如果要拒绝原假设,则下列式子()必须成立。(知识点7.2,答案:B)A.B.P-value<αC.F=1D.P-value>α6.对双因素方差分析(无交互作用),下列命题哪个是错的()。(知识点7.4,答案:C)A.SST=SSA+SSB+SSEB.SSB的自由度是s-1C.F临界值只有一个D.必须对两个因素分别决策7.如果要比较3种化肥(A、B两种新型化肥和传统化肥)施撒在三种类型(酸性、中性和碱性)的土地上对作物的产量情况有无差别,则往往考虑用()方法。(知识点7.5,答案:D)A.单因素方差分析B.三因素方差分析C.无交互作用的双因素方差分析D.有交互作用的双因素方差分析二、多单项选择题1.运用方差分析的前提条件是()()()()()。(知识点7.1,答案:ACDE)A.样本来自正态总体B.各总体的均值相等C.各总体的方差相等D.各总体相互独立E.样本必须是随机的2.下列指标中包含有随机性误差的是()()()()()。(知识点7.2,答案:ABCDE)A.SSAB.SSEC.SSTD.MSAE.MSE3.用LSD方法进行多重比较,若=2.5,则下列各式中哪些说明比较总体间没有显著差别()()()()()。(知识点7.3,答案:CD)A.B.C.D.E.4.对无交互作用的双因素方差分析表,下列命题哪个是对的()()()()()。(知识点7.4,答案:ADE)A.SST=SSA+SSB+SSEB.SSB的自由度是n-1C.可以计算三个F值D.SST的自由度是n-1E.F临界值可能是一个,也可能是两个三、计算题1.将24家生产产品大致相同的企业,按资金分为三类,每个公司的每100元销售收入的生产成本(单位:元)如下表。这些数据能否说明三类公司的市场生产成本有差异?(假定生产成本服从正态分布,且方差相同。α=0.05)20-3030-5050以上6975777276807072757670867280747268866680807274832.某SARS研究所对31名自愿者进行某项生理指标测试,结果如下表。这三类人的该项生理指标有差别吗?如果有差别,请进行多重比较分析。(假定该生理指标服从正态分布,且方差相同。α=0.05)SARS患者1.81.41.52.11.91.71.81.91.81.82.0疑似者2.32.12.12.12.62.52.32.42.4非患者2.93.22.72.82.73.03.43.03.43.33.5
3.为了解三种不同配比的饲料对仔猪影响的差异,对三种不同品种的猪各选三头进行试验,分别测得其三个月间体重增加量如下表所示。试分析不同饲料与不同品种对猪的生长有无显著差异。(假定其体重增加量服从正态分布,且方差相同。α=0.05)体重增量因素B因素A3031323136322729284.比较3种化肥(A、B两种新型化肥和传统化肥)施撒在三种类型(酸性、中性和碱性)的土地上对作物的产量情况有无差别,将每块土地分成6块小区,施用A、B两种新型化肥和传统化肥。收割后,测量各组作物的产量,得到的数据如下表。化肥、土地类型及其它们的交互作用对作物产量有影响吗?(假定作物产量服从正态分布,且方差相同。α=0.05)化肥种类土地酸性中性碱性A30,3531,3232,30B31,3236,3532,30传统27,2529,2728,25
第八章非参数检验8.1.非参数检验的概念8.2.卡方拟合优度检验8.3.单个样本K-S检验8.4.符号检验8.5.游程检验8.6列联表与卡方的独立性检验8.7等级相关系数习题一、单项选择题1.列联表的统计量的自由度为()。(知识点8.6答案:C)A.B.C.D.2.改变单元的变量单位,以下量中不受影响的是()。(知识点8.6答案:C)A.观察值B.期望频数C.统计量D.期望频率3.在独立性检验中,以下的取值不恰当的是()。(知识点8.6答案:D)A.0.05B.0.10C.0.01D.0.54.单样本K-S检验的统计量中是一个n次观察的随机样本观察值的()。(知识点8.3答案:B)A.理论次数B.实际累计频率C.理论累计频率D.实际次数5.根据α=0.05,n=20查《符号检验界域表》得临界界域为(5,15),因此要想拒绝,则()。(知识点8.4答案:C)A.=7,=13B.=8,=12C.=4,=16D.=9,=116.在数据序列111001101100010101110中,游程有()个。(知识点8.5答案:A)A.12B.6C.10D.27.用单样本K-S检验某学校期末统考的成绩是否是正态分布,若<则表明()。(知识点8.3答案:D)A.拒绝原假设,成绩分布是正态 B.拒绝原假设,成绩分布不是正态C.不能拒绝假设,成绩分布是正态D.不能拒绝原假设,成绩分布不是正态8.用一致对来考察两个变量n对等级数据的相关程度的指标是()。(知识点8.7答案:A)A.KendalltauB.Spearman等级相关系数C.Kendall’WD.K-S值二、多项选择题1.根据分布的性质,以下各式中正确的有()()()()()。(知识点8.2答案:ACE)A.B.C.D.E.2.以下关于列联表分布的叙述正确的是()()()()()。(知识点8.6答案:ABE)A.B.值与自由度有关C.越小,则越大D.分布与正态分布均具有对称性E..越小,则越小3.非参数检验与参数检验比较,其优势是()()()()()。(知识点8.1答案:ACD)A.不受总体分布状态的限制 B.检验的效率较高C.非参数检验的统计量表现形式易于理解 D.可以使用分类、顺序数据D.可以用小样本4.考察两个变量n对等级数据的相关程度的指标有()()()()()。(知识点8.7答案:AB)A.KendalltauB.Spearman等级相关系数C.Kendall’WD.K-S值E.Run值三、计算题1.赛马迷们会认为,在圆跑道上进行的赛马比赛中,某些起点位置上的马会特别有利。在有八匹马的比赛中,位置1是内侧最靠近栏杆的跑道,位置8是外侧离栏杆最远的跑道。请从赛马的结果中判断起点位置与赛马获胜是否有关。(α=0.05)起点位置12345678获胜次数34262832192221182.某金融机构要求呆账率不超过3%,某个月贷款240笔,呆账有7笔,问若α=0.05,可否认为该金融机构的呆账率为3%?3.某地144个周岁儿童身高数据如下表所示,问该地区周岁儿童身高次数是否呈正态分布(α=0.05)?身高人数身高人数64-68273-742468-69474-762269-70776-781670-711678-79271-722079-83672-732583-8514.某高校拟采取一项新的医疗保险措施。为了解广大职工对这一措施的看法,有关人士逐一征求了25名具有权威性、代表性的职工的意见。结果19人表示赞成,5人表示反对,1人表示没有把握。试问这些回答能否表明职工中赞成这项措施的人比反对的人多?(α=0.01)5.某厂产品包装箱平均重量为10公斤。今从生产线上取得由同一台机器充填的15个包装箱,称得重量(单位:公斤)为:10.2,10.05,10.13,9.1,10.3,9.2,9.15,10.21,10.22,10.08,10.25,9.18,9.23,10.31,9.3。判断充填过度与不足两者之间是否具有随机性。(α=0.05)6.某企业出台了一套改革方案,向不同工龄的职工进行调查得到下面的列联表,根据这张表能否认为不同工龄的职工对改革方案的态度是不同的?(α=0.05)态度职工工龄合计10年以下10-20年20年以上赞成2191040无所谓16101440反对1291940合计4928431207.甲、乙两位评酒员对10种品牌白酒的主观排序如下表,计算两个等级相关系数,问两位评酒员对白酒的评价意见具有一定的相关性吗?(α=0.05)品牌12345678910甲71568943102乙63249108571
第九章相关与回归分析9.1.相关分析9.2.一元线性回归模型9.3.一元线性回归模型检验、评价与预测9.4.多元线性回归模型与非线性模型习题一、单项选择题1.变量x与y之间的负相关是指()。(知识点:9.1,答案:C)A.x数值增大时y也随之增大 B.x数值减少时y也随之减少C.x数值增大(或减少)时y随之减少(或增大) D.y的取值几乎不受x取值的影响2.下列各直线回归方程中,哪一个是不正确的?()。(知识点:9.1,答案:B)A.=15+7X,r=0.92B.=20-5X,r=0.85C.=-10+2X,r=0.78D.=5-3X,r=-0.693.在回归直线中,回归系数表示()。(知识点:9.2,答案:D)A.当x=0时,y的期望值 B.x变动一个单位时y的变动总额C.y变动一个单位时x的平均变动量 D.x变动一个单位时y的平均变动量4.说明回归直线拟合程度的统计量主要是()。(知识点:9.3,答案:C)A.相关系数B.回归系数C.决定系数D.估计标准误差5.已知是的两倍,是的1.2倍,相关系数r=()。(知识点:9.1,答案:B)A.B.C.0.92D.0.656.计算估计标准误差的依据是因变量的()。(知识点:9.3,答案:D)A.数列B.总变差C.回归变差D.剩余变差7.如果变量x与y之间的相关系数,则说明两个变量之间是()。(知识点:9.3,答案:C)A.完全不相关B.完全正相关C.完全正线性相关D.高度相关8.多元线性回归模型中的回归系数表示()。(知识点:9.4,答案:D)A.当=0时,y的期望值 B.变动一单位时y的变动额C.变动一单位时y的平均变动量 D.在其他条件不变的情况下,变动一个单位时y的平均变动量9.对整个多元线性回归模型的显著性检验,应采用()。(知识点:9.4,答案:C)A.z检验B.t检验C.F检验D.卡方检验10.设某种产品产量为1000件时,其生产成本为30000元,其中固定成本为6000元。则总生产成本对产量的一元线性回归方程为()。(知识点:9.2,答案:B)A.Y=6+0.24xB.Y=6000+24xC.Y=24000+6xD.Y=24+6000x二、多项选择题1.单位产品成本对产量的一元线性回归方程为Y=85-5.6x,x单位为千件,Y单位是元;这意味着()()()()()。(知识点:9.2,答案:AE)A.单位成本与产量之间存在着负相关 B.单位成本与产量之间是正相关C.产量为1000件时单位成本为79.4元 D.产量每增加1千件单位成本平均增加5.6元E.产量每增加1千件单位成本平均减少5.6元2.如果两个变量之间的线性相关程度很高,则其相关系数应接近于()()()()()。(知识点:9.1,答案:DE)A.0.5B.-0.5C.0D.1E.-13.线性回归分析中的回归平方和是指()()()()()。(知识点:9.3,答案:BCE)A.实际值与平均值的离差平方和 B.估计值与平均值的离差平方和C.受自变量变动影响所引起的变差D.受随机变量变动影响所产生的误差E.总变差与残差平方和之差4.关于相关关系和函数关系正确的是()()()()()。(知识点:9.1,答案:ACE)函数关系是相关关系的一种特例B.相关关系是函数关系的一种特例C.函数关系就是完全相关关系D.相关关系就是线性相关关系E.完全不相关就是独立5.如果变量x与y之间没有线性相关关系,则()()()()()。(知识点:9.2,答案:ABCE)A.相关系数为0B.线性回归系数为0C.可决系数为0D.估计标准误差为0E.变量x与y不一定独立6.如果两个变量之间完全线性相关,则以下结论中正确的有()()()()()。(知识点:9.3,答案:ABD)A.相关系数=1B.可决系数=1C.估计标准误差=1D.估计标准误差=0E.回归系数三、计算题1.某公司8个所属企业的产品销售资料如下:企业编号产品销售额(万元)销售利润(万元)1234567817022039043048065085010008.112.518.022.026.540.064.069.0要求:(1)画出相关图,并判断销售额与销售利润之间对相关方向;(2)计算相关系数,指出产品销售额和利润之间的相关方向和相关程度;(3)确定自变量和因变量,求出直线回归方程;(4)计算估计标准误差;(5)对方程中回归系数的经济意义作出解释;(6)在95%的概率保证下,求当销售额为1200万元时利润额的置信区间。2.某公司的家下属企业的产量与生产费用之间关系如下:产量万件单位生产费用元要求:(1)画出相关图,并判断产量与单位生产费用之间对相关方向;(2)计算相关系数,指出产量与单位生产费用之间的相关方向和相关程度;(3)确定自变量和因变量,拟合直线回归方程;(4)计算估计标准误差;(5)对相关系数进行检验(显著性水平取0.05);(6)对回归系数进行检验(显著性水平取0.05);(7)在95%的概率保证下,求当产量为130万件时单位生产费用的置信区间。3.设有某企业近年来总成本与产量的资料,见下表。年份总成本Y产量X年份总成本Y产量X199332900400199986300900199452400600200013900012001995424005002001115700110019966290070020021548001300199774100800200317870014001998100000100020042031001500(1)试拟合以下总成本函数:(2)试根据以上结果推算总产量为1350时的单位产品平均成本。四、操作题Ex9_1中存放着在一项身高和体重的关系的研究中抽查的12个人的身高(单位:厘米)和体重(单位:公斤)的数据,以前的研究表明,人的体重和身高之间存在线性关系。(1)计算体重和身高间的Pearson相关系数为()。A.0.9922B.0.8389C.0.6442D.-0.9922(2)由第(1)题计算的Pearson相关系数判断两者间的相关程度和相关方向为()。A.高度负相关B.中度负相关C.高度正相关D.中度正相关(3)假如要建立体重(因变量)对身高(自变量)的线性回归模型,求得其经验回归直线为()。A.B.C.D.(4)检验回归系数是否为0即,则()。(显著性水平)A.,回归系数B.,回归系数C.,回归系数D.,回归系数(5)该线性回归模型的可决系数为()。A.0.9900B.0.8326C.0.6667D.0.4150
第十章多元统计分析10.1主成分分析10.2因子分析10.3聚类分析10.4判别分析习题一、单选题1.第k个主成分yk的系数向量是()。(知识点10.1主成分分析,答案:B)A.第k个特征根B.第k个特征根所对应的特征向量C.第k个特征根所对应的方差贡献率D.第k个特征根所对应的累计方差贡献率2.p个变量,其因子载荷矩阵,变量共同度是()。(知识点10.2因子分析,答案:B)A.各行元素之和B.各行元素平方和C.各列元素之和D.各列元素平方和3.已知ABCD四个样本点,计算其距离矩阵为:。选择最长距离法作为类与类间距离的测度方法,首先()聚为一类。(知识点10.3聚类分析,答案:A)A.A和BB.B和DC.A和CD.C和D4.距离判别时,待判样本x计算出与各类的距离分别为:,则()。(知识点10.4判别分析,答案:B)A.x归入第一类B.x归入第二类C.x还需进一步判断D.资料不足,无法判断二、多选题1.有关主成分的方差,下述表达正确的是()。(知识点10.1主成分分析,答案:ABCE)A.主成分的方差矩阵是对角矩阵B.第k个主成分的方差为对应的特征根C.主成分的总方差等于原变量的总方差D.主成分的方差等于第k个主成分与第j个变量样本间的相关系数E.任意两个主成分的方差是不相关的。2.因子分析中,第j个因子的方差贡献率()。(知识点10.2因子分析,答案:BE)A.是因子载荷矩阵中各列元素的平方和B.是因子载荷矩阵中各列元素的平方和占p个变量的总方差之比C.是因子载荷矩阵中各行元素的平方和占p个变量的总方差之比D.是说明变量所包含的原始信息被公共因子所解释的部分大小的E.是衡量各个公共因子相对重要程度的一个指标。3.对样本进行聚类,通常采用的相似性统计量有()。(知识点3聚类分析,答案:ABE)A.绝对距离B.欧氏距离C.夹角余弦D.相关系数E.切比雪夫距离4.下列表述正确的是()。(知识点10.4判别分析,答案:BCE)A.在费歇尔判别中,计算待判样本与各类的距离,判断待判样本与哪一类最近,就判它属于哪
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年中国金银工艺品市场调查研究报告
- 2024至2030年馅饼模型雕塑项目投资价值分析报告
- 2024至2030年锤击布氏条项目投资价值分析报告
- 2024至2030年磨砂胶片项目投资价值分析报告
- 2024年编织内袋项目可行性研究报告
- 2024年球盖菌项目可行性研究报告
- 2024年弹力绉纹布项目可行性研究报告
- 2024年复合铝箔专用布项目可行性研究报告
- 2024年原竹鞋垫项目可行性研究报告
- 山西省太原市六十六中2025届高三一诊考试英语试卷含解析
- 三战课件(舆论战、法律战、心理战)
- 第12课+明朝的兴亡-【中职专用】《中国历史》(高教版2023基础模块)
- 2022年广州市白云区赴珠海招聘中小学事业编制教师考试真题
- 高三英语一轮复习阅读理解天天练(Agriculture+农业 Society社会)选自China+Daily
- 慢性病(高血压、糖尿病)培训资料
- 《创新创业基础-理论、案例与训练》教案 第10课 选择商业模式
- 纪录片创作与理论
- (HAF603)民用核安全设备焊工认证考试题库 (单选题)
- 小学五项管理家长会课件
- 微机原理与接口技术-基于8086和Proteus仿真(第3版)习题答案
- 10米深基坑施工方案
评论
0/150
提交评论