社会统计学复习题(含答案)_第1页
社会统计学复习题(含答案)_第2页
社会统计学复习题(含答案)_第3页
社会统计学复习题(含答案)_第4页
社会统计学复习题(含答案)_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1社会统计学课程期末复习题一、填空题〔计算结果一般保存两位小数〕1、第五次人口普查南京市和上海市的人口总数之比为比较职工人数之比为 比例 相对指标;某产品的废品率为构造相对指标;某地区福利机构网点密度为 强度 相对指标。2各变量值与其算术平均数离差之和为 零 值与其算术平均数离差的平方和为 最小值 。3、在回归分析中,各实际观测值y与估量值y的离差平方和称为 剩余 变差。4、平均增长速度= 平均进展速度 —1〔或100。5、 正J形反J形 特征是变量值分布的次数随变量值的增大而逐步增多;曲线的特征是变量值分布的次数随变量值的增大而逐步削减。查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的根本状况,这种调查方式属于重点 调查。7、要了解某市大学多媒体教学设备状况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。8、假设某厂打算规定A产品单位本钱较上年降低6%,实际降低了7%,则A产品单位本钱计划 超 额 完 成 程 度 为A产品单位本钱打算超额完成程度

100 7100 1.06% B100 6%产品产量较上年增长 5%,实际增长了 10%,则B产品产量打算超额完成程度为B产品产量打算超额完成程度100 10% 4.76% 。100%100 5%10、从内容上看,统计表由 主词和宾词两个局部组成;从格式上看,统计表由总标题 、 横行标题、10、从内容上看,统计表由 主词和宾词两个局部组成;从格式上看,统计表由总标题 、 横行标题、纵栏标题和 指标数值〔或统计数值;四个局部组成。11、从变量间的变化方始终看,企业广告费支出与销售额的相关关系,单位产品本钱与单位产品原材料消耗量的相关关系属于 正 市场价格与消费者需求数量的相关关系,单位产品本钱与产品产量的相关关系属于 负 相关。12、按指标所反映的数量性质不同划分国民生产总值属于 数量 本钱属于 质量 指标。13、假设相关系数r=0,则说明两个变量之间 不存在线性相关关系 。二、推断题100%,〔×;答案提示:在季节变动分析中,假设季节比率大于100%,说明现象处在旺季;假设季节比率小于100%,说明现象处在淡季。〕〔×;答案提示:工业产值属于连续变量;设备数量属于离散变量〕3〔√;〕4、有意识地选择十个具有代表性的城市调查居民消费状况,这种调查方式属于典型调查。〔√〕5〔√〕6、用移动平均法修匀时间数列时,假设移动项数为偶数项,只要进展一次移动平均;假设移动项数为奇数项,则要进展二次移动平均〔×;答案提示:用移动平均法修匀时间数列时,假设移动项数为奇数项,只要进展一次移动平均;假设移动项数为偶数项,则要进展二次移动平均。〕7、对人们收入的测量可承受定距尺度,对人们智商水平的测量可承受定比尺度〔×;答案提示:对人们收入的测量可承受定比尺度,对人们智商水平的测量可承受定距尺度〕8、假设按月平均计算,则各季度季节比率之和为400%〔×;答案提示:假设按月平均计算,1200%。〕xf11xf11f1xf01f1xf01f1xf00f010、在平均指标的两因素分析中,

称为构造影响指数,

称为固定构xf1xf11f1xf01f1xf01f1xf00f0〕11、在抽样推断中,总体是确定的,总体参数的值是不变的;而样本总体是不确定的,样本〔√〕12×;答案提示:商品库存额和职工人〕三、单项选择题1、统计调查按调查登记的时间是否连续划分,可以分为〔D 。A全面调查和非全面调查 B一般调查和专项调查C抽样调查和普遍调查 D常常性调查和一次性调查2、在回归分析中,估量值与各实际观测值的平均数y的离差平方和称为〔A。A回归变差B剩余变差C判定变差 D总变差3、假设某总体次数分布呈稍微右偏分布,则有〔C 〕式成立。AM<X<Mo

X<M<Me

M<Mo

<X D Me

<X<Mo4、假设某总体次数分布呈稍微左偏分布,则有〔B 〕式成立。AM<X<Mo

X<M<Me

M<Mo

<X D Me

<X<Mo5、某城市居民家庭按年收入水平分为六组:10000元以下,10000~20230元;20230~30000邻组组距

100002023010000

50002 2邻组组距

500005000040000

55000 。2 2A15000和45000 B15000和55000 C5000和45000 D5000和550006〔C〕是现象各期环比进展速度的平均数,其计算方法是各期环比进展速度连乘n根。A平均进展水平B平均增长水平C平均进展速度D平均增长速度

y〔元〕之间的回归方程为=1+2x,这意味着家庭月收入每提高1元时,家庭月支出平均〔B 。A削减2元 B增加2元 C削减3元 D增加3元8、异众比率越大,各变量值相对于众数越〔A 。A离散B集中 C离散或集中D无法推断9〔B〕是在遵守随机原则的条件下,用样本指标代表总体指标不行避开存在的误差。A登记性误差B随机误差C系统性误差 D非随机误差10、如把握的是分组资料中各组标志总量而缺少各组次数的资料,则可以承受〔C〕公式计算平均数。A位置平均数 B算术平均数C调和平均数 D几何平均数11、假设按季平均计算,则各季度季节比率之和为〔A 。A400% B800% C1200% D1600%四、简答题1、指标和标志有何联系和区分?参阅教材P.14-P.152、简述定基进展速度和环比进展速度的含义及其关系。参阅教材P.143—P.1444、何谓等距抽样?等距抽样的根本步骤有哪些?参阅教材P.246五、计算题〔计算结果保存两位小数〕111月份比10月份比111210月份相比的变化程度如何?10月、1112a、aaa依据题意可知190%aa0

2105%aaa1

0 1 2a由于2

1 94.5%a a a aa 0 0 1所以该农贸市场1210=94.5%—100%=—5.5%答:该农贸市场12105.5%。户的家庭人口数。某社区60户家庭人口统计表按家庭人口数分组〔人〕户数〔户〕各组户数占总户数比重〔%〕135261032440415255915635合计601002、f解②:xxff10.05 20.130.440.25 50.15 60.053.5〔人〕4〔人〕3、某社区家庭人口资料如下,试计算该社区平均每户的家庭人口数。按家庭人口数分组〔人〕123456合计

家庭人口总数〔人〕2241358030303013、m解:xhx

301 3012124213538043052124213538043053063人。4、某甲、乙两乡青年农民操办婚事的消费资料如下表所示:地区地区32004100婚事支出的标准差σ〔〕850950要求:比较甲、乙两乡哪一个青年操办婚事平均消费额的代表性高?4、解:V 100% 850

100% 26.56 %甲 x 3200V 100% 950

100% 23.17 %乙 x 4100V >V

x 的代表性高乙答:乙乡青年操办婚甲 平均乙

费额的代表性高。一季度月平均劳动生产率。时时间总产值〔万元〕月末工人数〔人〕12月22012月220801月2401002月3001103月360120aa...a a 240300360

1 2 n1 nb b b...b212n1b2n

3 900 解:c 2.908021008021001101202

万元/人n1

412.90万元/人。时间工资支出额〔元〕月初职工人数〔人〕时间工资支出额〔元〕月初职工人数〔人〕1月2897843562月2951463423月2886403524月293760362产值〔万元〕产值〔万元〕产品种类 计量单位 2023年 2023年 幅度〔%〕甲吨50952乙件2020-5丙箱1001200〔〕三种产品的产值总指数;三种产品的价格总指数及价格变动对产值变动影响确实定额;利用指数体系推算三种产品的产量总指数。产品名称计量产品名称计量单位KPPQ0 0〔万元〕PQ1 1〔万元〕PQ PQ1 1 0 11KPQ1 1P01P

PQ0 1

1 PQK 1 P甲吨102509593.1372乙件95202021.0526丙箱100100120120合计——170235234.1898解: PQ

235〔1〕K

1 1

138.24%PQ

1700 001P PQ01

6PQ

234.1898235234.1898P1 〔2〕∵0P1

∴K

1 1

1 1

100.35%PPPP

0PQP 1 11答:三种产品的产值总指数约为138.24%%;三种产品的价格总指数为100.35%,由于价格0.8102137.76%。8、关于某超市三种商品的销售量和销售额资料如下表所示:商品名称计量单位商品名称计量单位销售额〔元〕〔%〕2023年2023年毛巾条10100009900瓷碗个2536004500尼龙布米1456005600〔〕三种商品的销售额总指数;三种商品的销售量总指数及销售量变动对销售额变动影响确实定额;利用指数体系推算三种商品销售价格总指数。8、解: 某超市商品销售量总指数两因素分析计算表毛巾条11010000990011000瓷碗个125360045004500尼龙布米114560056006400合计——192002023021900商品名称计量单位KQ商品名称计量单位KQ Q0QP〔元〕0 01 1QPK QP10 Q 00 P

20000解:〔1〕K Q

Q

0104.17%00Q

QP

21900〔2〕∵

∴K

114.06%Q

Q QP

19200QQPQQQPQ00QP销售量变动对销售额影响确实定额 QP QP 〔3〕K

104.17%KQ KQ

7

00P KQ

114.06%答:三种商品的销售额总指数为104.17.%;三种商品的销售量总指数为114.06%,销售量变270091.33%。19961997199819992023202320232023202320237511312812113615218918419021291996-2023年的产值资料如下表所示:年度91996-2023年的产值资料如下表所示:年度产值〔万元〕〔2〕2023年的产值。9〔1〕解①: 某福利企业1996~2023年产值趋势分析计算表t∵b

ntyty年份tytyt年份tytyt2设abt199617t575t11997211322641998312838491999412148416202351366802520236152912362023718913234920238184147264202391901710812023102122120100合计5515009386385

1093865515001136013.7697nt2

t2

10385552 825ya

tb

1500

5513.7697

742.6665

74.2667n n 10t

10 108=74.2667+13.7697×11≈225.73〔万元〕2023答:以最小平方法拟合直线趋势方程解②: 某福利企业1996~t

74.266713.7697t ;2023年的产值约为225.73万元。2023年产值趋势分析计算表1996—975-675811997—7113-791491998—5128-640251999—3121-36392023—1136-136120231152152120233189567920235184920252023719013304920239212190881合计015002272330设t

abt 令t0年份tyt年份tyttytt2ty 2272 y 1500∵b tt2

330

6.8848 a tn 10

150 t

1506.8848t=150+5.5455×11=225.73〔万元〕2023答:以最小平方法拟合直线趋势方程为t

1506.8848t;2023225.73万元。〔2〕解: 某福利企业1996~2023年产值趋势分析计算表年份 时间编号t 产值y19961199617519972113199831281999412120235136合计1557320236152202371892023818420239190202310212合计40927

〔万元〕设设abtt∵t1nt1553t 2nt4058y1nyt5735114.60y 2nyt9275185.40∴代入公式可得114.60a3b185.40a8b解得a72.12 b14.1672.1214.16t9当t11时t202310yy72.1214.16tt

;2023227.88万元。统计学问答题1.什么是统计学?怎样理解统计学与统计数据的关系?统计数据的科学,其目的是探究数据内在的数量规律性。统计学来源于对统计数据的争论,目的也在于对统计数据的争论,离开了统计数据,统计方法乃至统计学就失去了其存在意义。3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程工作失误造成的,从理论上看,这类误差是可以避开的。抽样误差是利用样本推断总体时所产生的误差,它是不行避开的,但可以计量和掌握的。4〔先分为集中趋势与分散程度,再连续细分,即综述7、8〕一组数据的分布特征可以从哪几个方面进展测度?答:数据分布特征一般可从集中趋势、离散程度、分布外形〔偏态和峰度〕几方面来测度。分布集中趋势的测度有众数、中位数、分位数、均值、几何平均数、切尾均值;分布离散程度的测度有极差、内距、方差和标准差、离散系数。简述众数、中位数和均值的特点和应用场合。分布集中趋势的三个主要测度,众数和中位数是从数据分布外形及位置角度来考虑的,而均值是对全部数据计算后得到的。众数一组数据分布的峰值,简洁计算,但不是总是存在,众数只有在数据量较多时才有意义,数据量较少时不宜使用。主要适合作为分类数据的集中趋势测度值,应用场合较少;中位数是一组数据中间位置上的代表值,直观,不受极端数据的影响,但数据信息利用不够充分,当数据的分布偏斜较大时,使用中位数或许不错。主要适合作为挨次数据的集中趋势测度值。利用了全部数据信息,提取的信息最充分,当数据呈对称分布或近三个代表值相等或相近极端数据的影响偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。标准差和方差反映数据的什么特征反映数据离散程度的特征.标准差反响数据的变化幅度,即上下左右波动的猛烈程度。在统计中可以用来算某变量值的区间范围〔即置信区间。所以,标准差和方差两者没有本质区分。5怎样理解均值在统计中的地位?答:均值是对全部数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必定性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到格外重要的根底地位。受极端数值的影响是其使用时存在的问题。10为什么要计算离散系数?答:在比较二组数据的差异程度时,由于方差和标准差是以均值为中心计算出来的,有时直接比较标准差是不准确的,需要剔除均值大小不等的影响,计算并比较离散系数怎样理解频率与概率的关系?频率的极限是概率吗?频率在肯定程度上反映了大事发生的可能性大小.尽管每进展一连串〔n次〕试验,所得到的频率可以各不一样,但只要n相当大,频率与概率是会格外接近的.,频率是概率的一个近似.概率是频率稳定性的依据,是随机大事规律的一个表达.实际中,当概率不易求出时,.频率的极限就是概率。概率的三种定义各有什么应用场合和局限性⑴古典概率试验的根本大事总数有限可能性一样;要求样本空间是有限并且是的。时机玩耍的很多问题可以满足这些条件;但现实生活的实际问题样本空间或者消灭的结果无限或者未知,因此具有较强的局限性⑵统计概率历史上同类事物发生的稳定频率。在日常生活与工作中,应用较为普遍;统计概率通常是大量重复试验中该大事消灭次数的频率,但有些试验是不能重复的⑶主观概率随机大事发生的可能性既不能通过等可能大事个数大量重复试验的频率来估量,但决策者又必需对其进展估量从而做出相应决策。具有主观随便性概率密度函数和分布函数的联系与区分表现在哪些方面一元函数下.概率分布函数是概率密度函数的变上限积分,就是原函数.概率密度函数是概率分布函数的一阶导函数.多元函数下.联合分布函数是联合密度函数的重积分.联合密度函数是联合分布函数关于每个变量的偏导.6随机变量的数学期望和方差与其次章所讲的均值和方差有何区分,联系数学期望又称均值,实质上是随机变量全部可能取值的一个加权平均,其权数就是取值的概率,方差一样12解释总体分布、样本分布和抽样分布的含义总体分布:全部元素消灭概率的分布样本分布:样本n个观看值的概率分布。抽样分布:n个观看值计算的统计量的概率分布简述评价估量量好坏的标准1、无偏性:估量量抽样分布的数学期望等于被估量的总体参数2、有效性:对同一总体参数的两个无偏点估量量,有更小标准差的估量量更有效3、全都性:随着样本量的增大时,点估量量的值越来越接近被估总体的参数。举例说明区间估量的根本原理答:总体参数的区间估量是在肯定的置信水平样本统计量加减抽误差表示的估量区间。3解释置信水平的含义〔画图〕置信区间中包含总体参数真值的次数样本统计量所构成的总体参数的估量区间。置信区间越大,置信水平越高。4.解释置信水平为95%的置信区间的含义答:总体参数是固定的,未知的,置信区间是一个随机区间。置信水平为95%的置信区间的含义是指,在一样条件下屡次抽样下,在全部构造的置信区间里大约有95%包含总体参数的真值。5.简述样本容量与置信水平、总体方差、允许误差的关系答:以估量总体均值时样本容量确实定公式为例: 样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。附加题:简(综)述述置信区间和显著性水平的关系显著性水平为a检验的拒绝域,与置信水平为1-a的置信区间互为补集的,也即:求承受域就是求置信区间,所以假设检验和区间估量本质是一回事。1.理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的原则.答:原假设通常是争论者想收集证据予以反对的假设;而备择假设通常是争论者想收集证据予以支持的假设。建立两个假设的原则有:〔1〕原假设和备择假设是一个完备大事组,而且相互对立〔2〕一般先确定备择假设。再确定原假设〔3〕等号“=”总是放在原假设上〔4〕假设确实定带有肯定的主观颜色〔5〕假设检验的目的主要是绝原假设。什么是显著性水平?它对于假设检验决策的意义是什么?答:假设检验中犯第一类错误的概率被称为显著性水平。确定了显著性水公平于掌握了犯第一错误的概率,对检验结果的牢靠性起一种度量作用什么是p值?p值检验和统计量检验有什么不同?答:p值是当原假设为真时,检验统计量小于或等于依据实际观测样本数据计算得到的检验统计量值的概率。P值常常作为观看到的数据与原假设不全都程度的度量。统计量检验承受事先确定显著性水平,来掌握犯第一类错误的上限,p值可以有效地补充供给地关于检验牢靠性的有限信息。p值检验的优点在于,它供给了更多的信息,让人们可以选择肯定的水平来评估结果是否具有统计上的显著性。6比较单侧检验和双侧检验的区分〔1〕问题的提法不同,双侧检验争论的是方法与旧方法是否有差异;单侧检验争论的是方法明显好于旧方法还是方法明显不如旧方法。2建立假设的形式不同,双侧检验的假设是H0:u=u0H1:u≠u0;单侧检验的假设是H0:u≤u0H1:u>u0或H0:u<u0H1:u≤u0。〔3〕否认的区域不同,双侧检验的否认区域是|Z|>Za/2Z<-Za或Z>Za1什么是方差分析?它争论的是什么?方差分析是检验多个总体均值是否相等的统计方法,来推断分类型自变量对数值型因变量是否有显著影响。它所争论的是分类型自变量对数值型因变量的影响。2方差分析中有哪些根本假定每个总体都应听从正态分布;每个总体的方差必需一样;观测值是独立的3简述方差分析的根本思想通过分析争论不同来源的变异对总变异的奉献大小,从而确定可控因素对争论结果影响力的大小7解释水平项平方和、误差项平方和的含义水平项误差平方和简记为SSA,它是各组平均值与总平均值的误差平方和各总体的样本均值之间的差异程度,是对随机误差和系统误差的大小的度量,因此又称为组间平方和误差项平方和,简记为SSE,它是每个水平或的各样本数据与其组平均值误差的平方和,反映了每个样本各观测值的离散状况,是对随机误差的大小的度量,因此又称为组内平方和或残差平方和1.相关分析与回归分析的区分与联系是什么?答:相关与回归分析是争论变量之间不确定性统计关系的重要方法相关分析主要是推断两个或两个以上变量之间是否存在相关关系,并分析变量间相关关系的形态和程度。回归分析主要是对存在相关关系的现象间数量变化的规律性作出测度。具有共同的争论对象,都是对变量间相关关系的分析,二者可以相互补充。相关分析可以说明变量间相关关系的性质和程度,只有当变量间存在相当程度的相关关系时,进展回归分析去查找变量间相关的具体数学形式才有实际的意义。同时在进展相关分析时,假设要具体确定变量间相关的具体数学形式,又要依靠于回归分析,而且在多个变量的相关分析中相关系数确实定也是建立在回归分析根底上但它们在争论目的和对争论方法上有明显区分。2简洁线性相关系数与等级相关系数的区分是什么?简洁线性相关系数要求两个随机变量的联合分布是二维正态分布变量值表现为等级的变量3.什么是总体回归函数和样本回归函数?它们之间的区分是什么?4什么是随机误差项和残差?它们之间的区分是什么?随机误差项Ui表示自变量之外其他变量的对因变量产生的影响,是不行观看的,通常要对其给出肯定的假设。残差项ei指因变量实际观看值与样本回归函数计算的估量值之间的偏差,是可以观测的。它们的区分在于,反映的含义是不同且可观看性也不同12t检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论