社会统计学期末复习题与答案整理.doc_第1页
社会统计学期末复习题与答案整理.doc_第2页
社会统计学期末复习题与答案整理.doc_第3页
社会统计学期末复习题与答案整理.doc_第4页
社会统计学期末复习题与答案整理.doc_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

社会统计学期末复习训练一、单项选择题 (20=210)1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是样本 2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。这项研究的总体是 332.1户家庭的年均收入 3.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。这项研究的总体是 22000名学生的每月生活费用 4.为了解地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。此处5000户是 样本5从变量分类看,下列变量属于定序变量的是 产品等级 6下列变量属于数值型变量的是工资收入 7.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为简单随机抽样 8某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。这种调查方法属于分层抽样 9.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,这样的抽样方式称为分层抽样10某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于 系统抽样11在频数分布表中,某一小组中数据个数占总数据个数的比例称为频率12在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为累积频率 13在频数分布表中,频率是指各组频数与总频数之比 14在频数分布表中,比率是指不同小组的频数之比15如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用环形图 16某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据 线图17当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形环形图 18在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为 39.19 19某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 89 20.某企业职工的月收入水平分为五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值为 3250元21为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分别为65、23、54、45、39,那么这5家企业12月份利润额均值为 45.222某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是 8823.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为5.5小时24对于左偏分布,平均数、中位数和众数之间的关系是众数中位数平均数25对于右偏分布,平均数、中位数和众数之间的关系是平均数中位数众数26离散系数的主要目的是比较多组数据的离散程度27两组数据的平均数不相等,但是标准差相等。那么 平均数大的,离散程度小28已知某单位平均月收入为3500元,离散系数为0.2,那么他们月收入的标准差为700 29一班学生的平均体重均为55千克,二班学生的平均体重为52千克,两个班级学生体重的标准差均为5千克。那么 二班学生体重的离散程度大30已知某单位平均月收入标准差为700元,离散系数为0.2,那么他们月收入的均值为350031. 正态分布中,值越小,则 离散趋势越小32已知某单位职工平均每月工资为3000元,标准差为500元。如果职工的月收入是正态分布,可以判断月收入在2500元3500元之间的职工人数大约占总体的68% 33如果一组数据中某一个数值的标准分值为-1.5,这表明该数值比平均数低1.5个标准差34某班级学生期末英语考试平均成绩为75分,标准差为10分。如果已知这个班学生的考试分数服从正态分布,可以判断成绩在65-85之间的学生大约占全班学生的68%35经验法则表明,当一组数据正太分布时,在平均数加减2个标准差的范围之内大约有 95%的数据36期中考试中,某班级学生统计学平均成绩为80分,标准差为4分。如果学生的成绩是正太分布,可以判断成绩在72分-88分之间的学生大约占总体的95% 37如果一组数据中某个数值的标准分值为1.8,这表明该数值比平均数高出1.8个标准差38某班级学生期末统计学考试平均成绩为82分,标准差为5分。如果已知这个班学生的考试分数服从正态分布,可以判断成绩在77-87之间的学生大约占全班学生的68%39经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 68%的数据40用样本统计量的值直接作为总体参数的估计值,这种方法称为点估计41用样本统计量的值构造一个置信区间,作为总体参数的估计,这种方法称为区间估计42某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例()偏高。如果要检验该说法是否正确,则假设形式应该是:0.1;:0.1 43某单位对该厂第一加工车间残品率估计高达13%,而该车间主任认为该比例()偏高。如果要检验该说法是否正确,则假设形式应该为:0.13;:Compare MeansPairedSample T Test,出现图114所示窗口。“Paired Variables”框中的变量作为分析变量,总是成对出现,指定要检验的两个变量到“Paired Variables”输入栏里的“Variable1”和“Variable2”中,在“Current Selections”栏中就会显示被选中的成对变量,在“Options”选项中可以进行置信水平和缺失值的设置,同单样本T检验。22 简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区别。 P207 T检验(T Test)是最常见的一种假设检验类型,主要验证总体均值间是否存在显著性差异。T检验属于参数假设检验,所以它适用的范围是数值型的数据,在网站分析中可以是访问数、独立访客数、停留时间等,电子商务的订单数、销售额等。T检验还需要符合一个条件总体符合正态分布。卡方检验(chi-square test),也就是2检验,用来验证两个总体间某个比率之间是否存在显著性差异。卡方检验属于非参数假设检验,适用于布尔型或二项分布数据,基于两个概率间的比较,早期用于生产企业的产品合格率等,在网站分析中可以用于转化率、Bounce Rate等所有比率度量的比较分析,23. 简要说明卡方的拟合优度检验和独立性检验的含义。 P178 2、拟合优度检验(1)拟合优度检验从总体的不同类别中抽取元素构成样本,样本包含总体中各个类别的元素,对不同类别的目标量之间是否存在显著性差异进行的检验称为拟合优度检验。拟合优度检验是检验中重要的一部分,可以同时对多个总体进行比较。在检验中,如果统计量小于给定的,那么就不能拒绝原假设,如果大于则拒绝。即检验的拒绝域是(k1),其中k1是自由度。自由度是可以自由变动的变量个数,在列联表中,自由度=(R1)*(C1)。独立性检验(1)独立性检验:检验还可用于判断两个分类变量之间是否存在联系,例如,对宿舍管理改革的态度是否与专业有关、对性行为的态度是否与学历有关等。如果两个分类变量之间没有关系,则称为独立,我们用判断它们之间是否关联,这时称为独立性检验。四、计算题 (每题15分,共30分) 12-16题题型一样,公式自己抄1.某校社会学专业同学统计课成绩如下表所示。社会学专业同学统计课成绩表学号成绩学号成绩学号成绩101023761010377510105270101024911010387010105388101025871010397610105493101026781010409010105562101027851010417610105695101028961010428610105795101029871010439710105866101030861010449310105982101031901010459210106079101032911010468210106176101033801010478010106276101034811010489010106368101035801010498810106494101036831010507710106583要求:(1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。解答:(1) 对考试成绩按由低到高进行排序如下:62,66,68,70,70,75,76,76,76,76,76,77,78,79,80,80,80,81,82,82,83,83,85,86,86,87,87,88,88,90,90,90,91,91,92,93,93,94,95,95,96,97其中,众数为76,中位数为83,平均数为83.1(2)对考试成绩进行适当分组,编制频数分布表如下:按成绩分组(分)频数累计频数累计频率6070337%7080111433%8090152969%901001342100%2.某行业管理局所属40个企业2011年产品销售额数据如下所示。40个企业2011年产品销售额企业编号销售额企业编号销售额企业编号销售额企业编号销售额115211105211033113621051212322103321463117131162313733127497141152413834135512415110259135117611916115261183611371081710027120371048881887281123812591291910729953910810115201193014240126要求:(1)对2011年销售额按由低到高进行排序,求出众数、中位数和平均数。(2)如果按照规定,销售额在125万元以上的为先进企业,115万-125万之间的为良好企业,105万-115万之间的为一般企业,105万以下的为落后企业,请按先进企业、良好企业、一般企业、落后企业进行分组,编制频数分布表,并计算累积频数和累积频率。解答:(1) 对2011年销售额按由低到高进行排序如下:87,88,91,95,97,100,103,103,104,105,105,107,108,108,110,112,113,115,115,115,116,117,117,118,119,119,120,123,124,125,126,127,129,135,136,137,138,142,146,152得到众数为115 ; 中位数为115.5 ;平均数为116.175 。(2)对企业按销售额进行适当分组,编制频数分布表如下:等级频数累计频数累计频率先进111127.5良好122357.5一般83177.5落后9401003.甲单位人均月收入4500元,标准差1200元。乙单位月收入分布如下所示。乙单位月收入分布表按收入分组(元)人数(个)3000分以下1203000400042040005000540500060004206000以上300合计1800要求:(1)计算乙单位员工月收入的均值和标准差。(2)比较甲单位和乙单位哪个单位员工月收入的离散程度更大?(提示:使用离散系数)解答:对分组数据先求出各组的组中值乙单位月收入分布表按收入分组(元)人数(个)组中值3000分以下12025003000400042035004000500054045005000600042055006000以上3006500合计1800(1) 乙单位员工月收入的均值为 乙单位员工月收入的标准差为(2)甲单位员工收入的离散系数,乙单位员工收入的离散系数,故甲单位员工月收入的离散程度大。4.某校社会学专业共有两个班级。期末考试时,一班同学社会学理论平均成绩为86分,标准差为12分。二班同学成绩如下所示。二班同学社会学理论成绩分组数据表按成绩分组(分)人数(个)60分以下2607077080980907901005合计30要求:(1)计算二班同学考试成绩的均值和标准差。(2)比较一班和二班哪个班成绩的离散程度更大?(提示:使用离散系数)解答:对分组数据先求出各组的组中值二班同学社会学理论成绩分组数据表按成绩分组(分)人数(个)组中值60分以下25560707657080975809078590100595合计30(1) 二班同学考试成绩的均值为分二班同学考试成绩的标准差为分(2)一班的成绩的离散系数为,二班的成绩的离散系数为故二班的成绩的离散程度大。5.某公司招聘职员时,要求对职员进行两项基本能力测试。已知,A项测试中平均分数为90分,标准差是12分;B考试中平均分数为200分,标准差为25分。一位应试者在A项测试中得了102分,在B项测试中得了215分。若两项测试的成绩均服从正太分布,该位应试者哪一项测试更理想?解答:在A项测试中,在B项测试中说明该位应试者在A项测试中的成绩高于均值1倍的标准差,在B项测试中的成绩高于均值0.6倍的标准差,故该位应试者A项测试成绩更理想。6.一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克;女生的平均体重为50千克,标准差为5千克。请问:(1)是男生体重差异大还是女生体重差异大?为什么?(2)男生中有多少比重的人体重在55千克-65千克之间?(3)女生中有多少比重的人体重在40千克-60千克之间?解答:(1)男生体重的离散系数,女生体重的离散系数为,故女生体重差异大。(2) 男生体重,令,从而, 故男生中有68的人体重在5565千克之间。(3) 女生体重,令,从而, 故女生中有95的人体重在4060千克之间。 7.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。(1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。注:解答:(1) 网络用户每天平均上网时间的95%的置信水平下置信区间为 即(2)年龄在20岁以下的网络用户比例的95%的置信水平下置信区间为 即8.为估计某地区每个家庭日均生活用水量为多少,抽取了450个家庭的简单随机样本,得到样本均值为200升,样本标准差为50升。(1)试用95%的置信水平,计算该地

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论