《社会统计学》作业(共享含部份答案)_第1页
《社会统计学》作业(共享含部份答案)_第2页
《社会统计学》作业(共享含部份答案)_第3页
《社会统计学》作业(共享含部份答案)_第4页
《社会统计学》作业(共享含部份答案)_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

社会统计学作业一、单项选择题1.为了解IT行业从业者收入水平,某研究机构从全市 IT行业从业者随机抽取 800人作为样本进行调查,其中 44%回答他们的月收入在 6000元以上, 30%回答他们每月用于娱乐消费在 1000元以上。此处 800人是(A)A.样本总体统计量变量2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为(C)A.频率累积频数累积频率比率3.离散系数的主要目的是(D)A.反映一组数据的平均水平B.比较多组数据的平均水平C.反映一组数据的离散程度D.比较多组数据的离散程度4.经验法则表明,当一组数据正态分布时,在平均数加减 1个标准差的范围之内大约有(B)50%的数据68%的数据95%的数据99%的数据5.在某市随机抽取 10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为(A)A.B.CD6.用样本统计量的值直接作为总体参数的估计值,这种方法称为( A)A.点估计B.区间估计C.有效估计D.无偏估计某单位对该厂第一加工车间残品率的估计高达 10%,而该车间主任认为该比例)偏高。如果要检验该说法是否正确,则假设形式应该为(B)TOC\o"1-5"\h\zH0 : >0.1; H1 :H0 : <0.1; H1 :H0 : =0.1; Hi:丰H0 : >0.1; H1: <8.下面哪一项不是方差分析中的假定( D)A.每个总体都服从正态分布B.观察值是相互独立的C.各总体的方差相等D.各总体的方差等于09.判断下列哪一个不可能是相关系数( D)A.0C.0.5D.10.用于说明回归方程中拟合优度的统计量主要是(D)相关系数离散系数回归系数判定系数11.某地区政府想了解全市 332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。这项研究的总体是(A)A3000户家庭3000户家庭的年均收入12.下列变量属于数值型变量的是( A)A.工资收入产品等级学生对考试改革的态度企业的类型13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形(A)A.环形图B.饼图C.直方图D.条形图14.在频数分布表中,频率是指 (C)各组频数与上一组频数之比各组频数与下一组频数之比各组频数与总频数之比各组频数与最大一组频数之比15.两个定类变量之间的相关分析可以使用( A)系数系数r系数Gamma系数16.根据一个样本均值求出的 90%的置信区间表明( C)A.总体均值一定落入该区间内B.总体土讥S有90%勺概率不会落入该区间内C.总体土MS有90%勺概率会落入该区间内D.总体土MS有10%勺概率会落入该区间内17.已知某单位职工平均每月工资为 3000元,标准差为 500元。如果职工的月收入是正态分布,可以判断月收入在2500元—3500元之间的职工人数大约占总体的(B)A.95%B.68%C.89%D.90%18.方差分析的目的是( D)A.比较不同总体的方差是否相等B.判断总体是否存在方差C.分析各样本数据之间是否存在显著差异D.研究各分类自变量对数值型因变量的影响是否显著.对于线性回归,在因变量的总离差平方和中, 如果回归平方和所占比例越大,那么两个变量之间(A)A.相关程度越大B,相关程度越小C.完全相关D.完全不相关.正态分布中, 值越小,则(B)离散趋势越小离散趋势越大曲线越低平变量值越分散21.从含有N个元素的总体中,抽取 n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为(A)A.简单随机抽样系统抽样整群抽样分层抽样22.某地区 2001-2010年人口总量(单位:万人)分别为 98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据( D)A.茎叶图环形图饼图线图23.如果一组数据中某一个数值的标准分值为 -1.5,这表明该数值(D)A.C.D.24.某班级 10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、92、72,那么该班考试成绩的中位数是 (A)8972889525.某班级学生期末英语考试平均成绩为 75分,标准差为 10分。如果已知这个班学生的考试分数服从正态分布,可以判断成绩在 65-85之间的学生大约占全班学生的(A)A.68%B.89%C.90%D.95%26.已知某单位平均月收入为3500元,离散系数为0.2,那么他们月收入的标准差为(A)A.700C.3500D.17500027.在假设检验中,不拒绝虚无假设意味着( D)A.虚无假设是肯定正确的B.虚无假设肯定是错误的C.没有证据证明虚无假设是正确的D.没有证据证明虚无假设是错误的28.在因变量的总离差平方和中,如果回归平方和所占的比例越大,则两变量之间(A)A.相关程度越高B.相关程度越低C.完全相关D.没有任何关系29.从两个总体中各选取了 6个观察值,得到组间平方和为 234,组内平方和为484,则组间方差和组内方差分别为( ? )A.234,121B.117,121C.D.117,8130.在回归方程中,若回归系数等于 0,这表明(B)因变量 y对自变量 x 的影响是不显著的自变量 x对因变量 y 的影响是不显著的因变量 y对自变量 x 的影响是显著的自变量 x对因变量 y 的影响是显著的31.某班级有 60名男生,40名女生,为了了解学生购书支出,从男生中抽取 12名学生,从女生中抽取 8名学生进行调查。这种调查方法属于(C)A.简单随机抽样整群抽样分层抽样系统抽样32.某企业职工的月收入水平分为以下五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值近似为(D)A.3000元3500元2500元3250元.对于右偏分布,平均数、中位数和众数之间的关系是( A)A.平均数〉中位数>众数中位数〉平均数>众数C.众数〉中位数〉平均数众数>4■土§数>中位数.两组数据的平均数不相等,但是标准差相等。那么 (C)平均数小的,离散程度小平均数大的,离散程度大平均数大的,离散程度小两组数据离散程度相同.在假设检验中,如果所计算出的 P值越小,那么检验的结果(A)越显著越不显著C.越真实D.越不真实36.如果物价与销售量之间的线性相关系数为 -0.87,而且二者之间具有统计显著性,那么二者之间存在着(A)A.高度相关中度相关C.低度相关D.极弱相关.回归平方和(SSR反日^了y的总变差中(A)A.由于x与y之间的线性关系引起的y的变化部分除了x对y的现有影响之外的其他因素对y变差的影响C.由于x与y之间的非线性关系引起的y的变化部分D.由于x与y之间的函数关系引起的y的变化部分38.根据一个具体的样本求出的总体均值 90%的置信区间( A)A.以90%勺概率包含总体均值绝对包含总体均值10%的可能性包含总体均值D.绝对不包含总体均值.在假设检验中,虚无假设和备择假设( C)A.都有可能成立B,都不可能成立C.有且只有一个成立D.备择假设一定成立,虚无假设不一定成立.在方差分析中,某一水平下样本数据之间的误差称为( A)组内误差组间误差组内平方组间平方、名词解释1.抽样单位与抽样框2.普查与抽样调查3.参数与统计量4.方差与标准差5.独立样本与配对样本6.总体与样本7.抽样分布8.二维表9.相关系数.组内均方.普查.误差减少比例13.散点图14.正态分布15.最小二乘法16.概率抽样17.中位数18.相关系数19.区间估计中心极限定理假设检验三、简答题1.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。1)网络供应商的姓名2)每月的网络服务费3)每月上网时间4)上网的主要目的5)上周收到的电子邮件数量6)每月用于网上购物的金额7)上月网上购物的次数8)使用的电脑的品牌9)上网是否玩游戏10)电脑是否带有光盘刻录机2.调查方法主要包括哪几种?简要说明各种方法的优缺点。3.什么是简单一元线性回归分析?其作用是什么?4.简要说明社会研究过程。5.按测度水平,变量可分为哪几类?并举例说明。6.简要举例说明在分析双变量的关系时, T检验和卡方检验的主要区别。7.等距分组和不等距分组有什么区别?请举例说明。8.举例说明什么是自变量和因变量,二者之间是什么关系?.简要说明卡方的拟合优度检验和独立性检验的含义。.条形图和直方图有什么区别?.简述众数、中位数和平均数作为测量中心趋势的指标所适用的数据类型。.简要举例说明在分析双变量的关系时, T检验和卡方检验的主要区别。.举例说明什么是离散变量和连续变量。.SPSS主要有哪些功能?.在SPSS中如何定义变量属性?.统计表主要由哪几部分构成?.简述相关系数的取值与意义。四、计算题(每题15分,共30分)1.某校社会学专业同学统计课成绩如下表所示。社会学专业同学统计课成绩表学号成绩学号成绩学号成绩101023761010377510105270101024911010387010105388101025871010397610105493101026781010409010105562101027851010417610105695101028961010428610105795101029871010439710105866101030861010449310105982101031901010459210106079101032911010468210106176101033801010478010106276101034811010489010106368101035801010498810106494101036831010507710106583要求:(1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率.为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。通过分析得到以下结果:方差分析表变差来源SSdfMSFSig.回归ABCD残差EF一——总计11一一——要求:(1)计算上面方差分析表中ABGDE、F处的值(2)商品销售量的变差中有多少是由价格的差异引起的?(3)销售量与价格之间的相关系数是多少?.某公司招聘职员时,要求对职员进行两项基本能力测试。已知, A项测试中平均分数为90分,标准差是12分;B考试中平均分数为200分,标准差为25分。一位应试者在A项测试中得了102分,在B项测试中得了215分。若两项测试的成绩均服从正太分布,该位应试者哪一项测试更理想?.某公司欲了解广告费用x对销售量y的影响,收集了20个地区的数据,并对x、y进行线性回归分析,得到:方程的截距为364,回归系数为1.42,回归平方和SSR=1602708.6残差平方和SSE=40158.0Z要求:1)写出广告费用y与销售量程x之间的线性回归方程。2)假如广告费用投入50000元,根据回归方程估计商品销售量。(3)计算判定系数R2,并解释它的意义.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。(1)试用95%勺置信水平,计算网络用户每天平均上网时间的置信区问。(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区问注:Z0.025 1.96.某企业使用3种方法组装一种新的产品,为确定哪种方法生产效率最高,随机抽取30名工人,并指定每人使用其中的一种方法。通过对每个工人生产的产品数进行分析得到下面的方差分析表。请完成方差分析表。变差来源SSdfMSFSig.组问2100.000组内3836一一总计29一一一.某校社会学专业共有两个班级。期末考试时,一班同学社会学理论平均成绩为 86分,标准差为12分。二班同学成绩如下所示。二班同学社会学理论成绩分组数据表按成绩分组(分)人数(个)60分以下260~70770~80980~90790~1005合计30要求:(1)计算二班同学考试成绩的均值和标准差。(2)比较一班和二班哪个班成绩的离散程度更大?(提示:使用离散系数)8.某调查公司研究出租司机每天收入(元)与行驶里程(公里)之间的关系。对30位出租车司机进行调查,并根据每天的收入y、行驶里程x进行回归,得到:方程的截距为162,回归系数为0.6,回归平方和SSR=2600残差平方和SSE=513要求:(1)写出每天的收入y与行驶里程x之间的线性回归方程。(2)假如某司机某天行驶了300公里,根据回归方程估计他该天的收入。(3)计算判定系数,并解释它的意义。计算题答案:计算题1答案:管:(注,老卿要求作业答案必须手写)Q)社会学专业同学统计课成绩表按由低到高的时进行排序得出众数是76分、中位薮是梵分』平均薮是分0(2)社会学专业同学统计课成绩的频数分布表如下频数分布表•艘累倾数累计频率60-70333.41%70-8011141*91%S0-9O152932.95%1 90-100134247.73% |合计4288100.00%计算题2答案:答2(注,老师要求作业答案必须手写)解;⑴;SST=SSR+SSE=1642866.67-205158.07=1437708.60智工计算方差力析表中A值为1437703.6k(2)判定系数公式;r二二咨二1LQS.6r,£花1二科519(SST1642s8662新商品销售量的变差中有37.5通是由价格的差异引起的。(3)相关系数声:JjO虚751〉。.加答:销售量与价格之间的相关系数是0.94.计算题3答案:(注「老师要求作业答案必须手写)解;"(山C71)第一组测试:一士工二(90,120笫二组测1六片。⑵0.259标准正态,Z;=—二"2二四二1 查表得①[(1)=0.3413=34.13^c12心二^^二29-20。二q6查表得力3(0.6)=0.7257=72,W%a25答:两项测试的成绩埼服从正态分布,A项测优的成绩更理想。计算题4答案:(注:老师要求作业答案必须手写)解:己知:方程的截距为3也,回归系数为L42(1)根据线性回归方程公式,F二仇:十氏¥r=364+L42JT(2)根据回归方程计算商品销售量二己知:*二500001『=364+1.42才=364+L42乂50000=71364*(3)判定系数R:己知:SSR为回归平方和工1602708.6SSE为凌差平方和二40158.07SST=SSR+SSE=1602708.6+40158.07=1642866.67R:SSR1602-08.6n_寸弧K二 二 二。・9756=97.56%5ST1642g66十答:销售量是靠广告费用收入的。

计算题5答案:(注:药根求作业善把颁手写)<7 CT鞋士(D均直的置售区间:(看-Z2门.支42三国)已知:乙二=1%,b=2.5,n=225,er2.5Z干-1.96W5-0.323己知।X=6,5,[6,5-0,323,6.5+0.323]=[6,1%6.82]答:在9部的置售水平,网络用户每天平均上网时间的置信区间为6.17,6.我之间。(2)已知=2三=乙.:,=1.96,n=225根据比例的置信区间公式计算:A1-P)”."丁广,rPQ—P).严数P(1-P) J0.4(l-0.4)ZjJ 二L96XJ 三 二0.064二区4的KA公式计肆।[0+4-0,QS4.0.4-0.064:=[。3330.46<格以95%的置信水平,年龄在2C岁以、'的网络用户比例的置信区间为0.336,0.46乳

解:(注:器陵重作业答案里3!手写,方差分析表段差来调SSDfMS7Sig-组间SSAIMSA=210二gJHe0.000组内SSE=3836——总讨n-l=25—解:根据方差分析表,已知:3亚二38笛,脂后2助x1=29,n=30,k=3,①根据组间均方公式计苴:MSk①根据组间均方公式计苴:MSk垣间平方和—目由度-EK210 =2X210=420②粮据蛆内均方公式计苴:的S=蛆内平方和自由度②粮据蛆内均方公式计苴:的S=蛆内平方和自由度3S36侬二30^314Z.074③在计算出殂间均方m或和组内均方后,产二黑

tr\■*1■遥・一产==1.4TS1420^4@55T=55A+S5EEST=420+3836=425b根据方差分析计算得出:方差分析表变差来源S5Df临rSi&妲间SSA二42。MSA二2i。i六,二-7三二14TB■«■a'£■■o.m组内SSE=333&n-kNT恪乒14E,m——总计SSTKW56ii-l=29——计算题7答案:(注:格俄茨怛11獴&修手写)解:(1)36据分制&据均值的公式计尊“书『80]空_/;工工-工X--/工.-55x2-65. x9^S5x--95x5,一;「二r "爆嗨得分翎S«方差和林唯君的公式it算:【书侬】

teQ<*x);x/b标准差及V - "==25,22⑵根品更敌系皴的公式计苴:标准差4口一班离散程度M=沟鼠=玄==0,14标准差b,*、)二Kara程度:v*=均值=药=三三=o.33答:二班成覆比一班成羲的惠散程度更大.计算题8答案:♦注二卷陵求作业答室i海手写,解:已知:方程葩截距为1B2.回归系数为C6口)根据线性回归方程公式:尸=£二十占/y=162+0.6/电)根据回归方程讨菖商品销售量:已知:『二300y-162+0.61二162+0.6X300二342苔:根据回日方程估计他透天的改入为3式元.⑶判定羯SR*:已知:骷R为回归平方和:2BOQ55E为残差平方和:513SST=SSR+SSE=2M0+513=3113t4HWOO及二三二三二00352=B352%容:混羽出乏主正粒的收入中।客$3.52渥由行驶里程决定的口《社会统计学》期中试题一、某工厂所生产的灯泡,其寿命服从正态分布,标准差为 8小时,今随机抽取样本大小n=16,得样本平均寿命为1000小时,在置信度95%下,求该厂产品的:样本总量未知,方差已知。.平均寿命的估计值1000小时(中心极限定理).平均寿命之95%的置信区间及置信区间长度解:总体未知,标准差=8;样本容量n=16(小样本),样本均值=1000,置信度0.95.利用总体标准差已知公式,得标准正态分布的置信区间为X1.96r,X1.96r=[1000-1.96*8/4,1000+1.96*8/4]=[996.08,1003.92]n 一n长度为7.84.、某超市,从其顾客中随机抽取,现随机抽取 64位,衡量其结帐所需要时间X,设X近

646464似正态分布,得 xi320, xi22608,贝UTOC\o"1-5"\h\zi1 i1N为样本容量,n.>=50,方差未知情况之下用样本方差约等于已知方差.顾客平均结帐时间之估计值.求顾客平均结帐时间之95%的置信区间及置信区间长度1n9 -9 1解:X=320/64=5,S2=——( Xi2nX2)= (26086425)=16,故S=4n1i1 641置信度为0.95,应用大样本总体均值区间估计公式 ,得X1.96r,X1.96——n 、.n三、有6三、有6个人接受心理测验,得到分数如下表:(设测验分数呈正态分布)X分数86102412X分数86102412则1.平均分数之的估计值。2.求平均分数之95%的置信区间及置信区间长度。解:小样本区间估计,应该用t检验的区间估计公式n=6,X=7,S2=-nn_n=6,X=7,S2=-nn_-1(,1X2nX2)则区间估计为s st2「n,Xt2-n 72.5706374,762.5706374.62.,i1,2,则以下哪一个为的无偏估计量。71823 " ,4104为无偏估计量五、若1100来自于同一总体的随机样本,其总体的平均数为100— 1100, 1五、若1100来自于同一总体的随机样本,其总体的平均数为100— 1100, 1 1 29696是否为的无偏估计量?六、设A、B二市去年每人平均所得分配为近似正态分布,2 0.5万元,随机分别从A从A、B二市各抽出n120人,n210人,得出X4.3万元A市Y3.2万元B市试在置信度95%下,求试在置信度95%下,求A、B两市平均所得差额 12的置信区间。解:小样本、总体标准差已知,二总体均值差的区间估计,采用Z检验区间估计公式3.2万元B市20.5万元,n120人,n210人,X4.3万元3.2万元B市置信度0.95,X1X2J2 2..置信度0.95,X1X2J2 2..X1X24.33.21.962 20.5 0.5 ,「,4.320 103.2 1.962 20.5 0.520 10=[1.1-0.38,1.1+0.38]=[0.72,1.48]自两正态总体,平均数己知,分别随机抽n1 8,=[1.1-0.38,1.1+0.38]=[0.72,1.48]自两正态总体,平均数己知,分别随机抽n1 8,n210其样本平均数为72, 72,样本方差为S12240,S;180,在置信度95%下,2求-A的估计值及221~2221~22L的置信区间?2解:小样本二总体方差比区间估计, 且总体平均值为已知, 以样本方差比为总体方差比的 估计值,即240/180=4/3,S1S2FRQS1S2FRQ2G2

S2_F12n加_43—

F0.0528,10__43_ 0.345,5.132F10.0528,10标准差比的区间估计则在上述基础上开根号,即,标准差比的区间估计则在上述基础上开根号,即,0.345,,5.132 0.587,2.265八、某城市购买A八、某城市购买A公司牛奶的家庭比例被认为是,若一随机样本n=10个家庭中至多有3个解:第1小题。抛弃原假设,意味着算出的先算出临界值,再查表计算得到对应的0.30.60.60.410解:第1小题。抛弃原假设,意味着算出的先算出临界值,再查表计算得到对应的0.30.60.60.4101.94家庭购买A公司,则我们抛弃原假设 0:而赞成Pv。①若真正比例是,求 =?②若真正比例,假定 =0.05,求=?z值落在拒绝域;上述检验为单边检验, 由此,值。。根据公式查表,对应的1-=0.974,由此,第2小题。在真实比例为0.5的情况下,求接受错误的原假设p=0.6,即犯第二类错误的概率大小。此时,先在错误的原假设中求出接受域, 得出接受域上下界值后,放在真实的比例中标准化,即得到第二类错误的大小。S2[0.6-1.96*……尸[0.51,0.69]标准化:ZiJ10)=0.217,Z2J10=(Z2)-(Zi九、据统计,某小学一年级学生以往的身高平均数 120厘米,今于新生中,抽取64名得平均数为123,方差为36,试问,该小学一年级小学生身高是否己增加? 0.05解:单边检验,大样本单总体假设检验 。列出原假设H0:科二120,H1:科>120算出Z值=4,临界值(单边)=1.65,Z>临界值,拒绝原假设,即有增加。十、某公司招聘人才,在所抽 36位女生及64位男生应试中,女生的平均成绩为 76分,标准差为6分,男生的平均成绩为 82分,标准差8分,0.05下,检验男生成绩是否优于女生?>临界值=1.65,故拒绝原假设,即优于女生。H^一、某城市有某项公共政策问题,访问 100人,赞成者有80人,在显著水平5%下,检验全体赞成的比例是否为 60%?>临界值1.96,拒绝原假设,即认为全体赞成的比例不是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论