国家开放大学《社会统计学》网上作业1-5参考答案202411_第1页
国家开放大学《社会统计学》网上作业1-5参考答案202411_第2页
国家开放大学《社会统计学》网上作业1-5参考答案202411_第3页
国家开放大学《社会统计学》网上作业1-5参考答案202411_第4页
国家开放大学《社会统计学》网上作业1-5参考答案202411_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《社会统计学》形考任务形考任务1(占比20%)表1是某大学二年级135个同学的《社会统计学》课程的期末考试成绩,请将数据输入SPSS软件,并(1)对考试成绩进行排序和分组(40分),(2)制作频数分布表(30分)并绘制频数分析统计图(30分)。请注意分组时按照下列标准:等级AA-B+BB-C+CC-D+DF分数90-10086-8983-8580-8276-7973-7570-7266-6963-6560-620-59请注意分组时按照下列标准:表1某专业二年级同学社会统计学期末考试成绩(百分制)学生成绩学生成绩学生成绩学生成绩学生成绩186283455888270109712602965569383881108036530305785848811187428317858838568112665853286599386871138468733846095878811483770348761718891115858643585629089761167895136936386908711781105837966489918111881119038826589926111971125039786683937212086138740806784948612191148241746844952912266156542726968963712358166843737089978212468178644867184988212580188045857286998212677198146907379100851275520704769747810178128542180488675871028012962

224949867688103901305423805084778210482131652470518178831057213274255952907992106861337026805334808610780134722752548481861088213573解:K按成绩低至高排序如卜一表土学成缜学中成纨学生成纨学生成领学生成筑学生成统学生成绩428864427240so7*S36386<158995293659孑721f]2K。114837286708930301565105721.07SO33S48086119028342965134721.10跳)508186469053341316543731258054S49452909637112661357319SI67星41068662906H4412266417451KI71841201039022491668132749181]13S4帆879112506968X976117SI3S5138712191951K5681267711MRI358S348779922752124683178U482458575S7369312H54476934783N825785M687569313054770747877K2IOO8590&759931275520701OI78978211585111876095]0582470L16-7£QX82]S65,RS37961235RS270737999S217H676KK25591337018£。104K232R683RR260617121KD1OH8244S684HS926110971238058S34K8687SS1.296211971S0ei6耗3S664X9

2、成绩分组表如下:等级AA-B+BB-C+CC-D+DF分数90-10K6-K83-SSO-876-773-770-7(56-663-660-60-5A数132816228412753173、制作频数分布表如下:等级AA-B+BB-C+CC-IMDF分90-1086-883-880S76-773-770-766电63-660-60-5数人数】328162241275317l'f分比9.63%20.74%11.85%16.3%5.93%2.96%8.89%5.19%3.7%.2.2%%J2„59皈4.频数分析统计图如下:

形考任务2(占比20%)

表1为某大学对100个学生进行了一周的上网时间调查,请用SPSS软件。(1)计算学生上网时间的中心趋势测量各指标(20分)和离散趋势测量各指标(30分)。(2)计算学生上网时间的标准分(Z值)及其均值和标准差。(20分)(3)假设学生上网时间服从正态分布,请计算一周上网时间超过20小时的学生所占比例。(30分)表1某专业一年级同学一周上网时间(小时)学生上网时间学生上网时间学生上网时间学生上网时间学生上网时间1132118411461881102922224276219821038232243963248320412241044864138421582513451065218516626261046186621861071327124726671087108528224814681388219329194986920891910183010501070219010113312251137112913212103230522872159271320338531273269328141934205410742094191515351755975179515168361456107619961017837857127799720181538125824782198819203915592679179914202240136020801610018解:(1)集中趋势前解均拗152中蝴为14.0,掇为取高雌孰四分(徽掰为P25为10、P5Q为凡P乃为20、方勤39.515、标准差为6.286,板差为29.步黜AnalyzeDescriptiveStatisticsFrequenaes'—上网时间(N选集巾黄势指标:meaiiimedian,mode,侬umunhmaximun离散詹雪指标:quamk九\Farimice)Kd.deviaiion,Rang。⑶瘫分Z值(飙作业*I步骤Anal环——DescnptiseStatisticsDescriptive-rSavesrandardi;edvaluesaivananles即可◎均数位15i标徙差62S6步骤Analyze DescriptiveStatistics Descriptive Opuons-一勾选(mMn,Std.deviation)⑶一周上网时睡过20小时除甥占比例21%.步螺LMalyzu SehcrCases if上网时间>20h步隈,2:Allaire DescnptnieStatistics Descriptive 上网时间超过2Oh。得出上网时间超120h入敷为21人,占总人数的2】脸形考任务3(占比20%)学习完7-12章后,你可以完成本次形考任务了,本次任务的题型包含:单项选择题(5道),名词解释(5道),简答题(2道),计算题(2道),本次任务按照百分制计,占形成性考核总成绩的20%。、单项侬择题(在各侬的落选衿家中.JT有I项是11M的,讲构il;确衿索的序号.填石在逊中的拓七内j打小题工分.然2。分)1-学校后的」也团想了他学校2i000学生的4寻月生清曲用*从中抽叱2200名半引挑彳j调行,以推断所有学生的寿JIL活四川水平=迂项榻I*的总体是<C?322(MJ0必学,七2200为学生320()。.句孝‘I;中」年月'IW3-症^用d"CO名学生的毋月个活费用从变坦分类看,卜KU绽生届卜定序及兄的是CC?」A.专皿R.性另I」C,严晶等级O.收入曲频数分布表中,比率是指£D5各却[频数,I-组颇数之比各组频数与卜一一组频数之比符组频数。总频数之比不同小组的频数之比某」也区2CXH-2OIO公人口总纪<单传>万人》分别为9“102,1。3.106.10K.109,IIO«111.114.IIS.F列I哪利।图J哙显运舍邦[述这蛙数据1D、A.法口上图R.耳;7胫图u饼图O.登野图5.本艮鬼 个中羊木均址求”"向9。/的启HJ;%」川衣叫<C:>A-心体」与值 也落入俵I工|闻内R.定L体;1包也有QO^T」趣率不会漕入俵区「山内Q-,曲体均;CL<1wy/lYJ他率会落入该国R"内O.但体均<11钓10名的橄冲-会蚱入垓区I可内c>.划断r列।那-个4、f能是相关卓越:cc?-C.R^<).34U1.32r>.r>7.卯J中比武中.呆功:级学生到EiI•产,产均J能呈瑾为SO!1.4/PHJ:笄为4分n切I栗学'曰妁确纽之星上太5A小3T以户」闺〃&缴Yl:72号分之间的学,I大为「'忌体的匚A3A.05%G.6sxU.H9喙IJ.OOMK-il:-fitcJ'fr4T匚3,h,Wd£A)人.t居t改』回巧八世小ll. 离"跑心t廿R通人£1 “H?设,的]氐•产I〉.f*±rt1i'L唐碧卡,依少,KKiIHJCf-」W可二必Zr;;•:与卜相亍■十「白仲£也HU,人-力£个.齿f1、尚幻」值认「口⑥。〉及上IJ.XW¥K^fiTUAlI*r'』4!rrtju- 咎於J十fitr力,片工布W:D,钟总体的方芳等「0io.对那费的win分析■”」,学历、年龄、广Ui、性别、收入都是因变Hl.其中收入的gw-l.基数为。一薜,这衣明IA>A,收入何:增排I心消选用力nd后”B,消费小£增力III:,心.唱<入上伸力[I。3TC收入与消费的相关系数力。出15,收入对消彼蜷响的品著性为力屏二,抬记打弁耶庠,<电陋i-i公.共io方a>1.1由择中小次目」而怦HE衿上扣时千叮"立航H次丁工才爱的寸山产山TJ白句J志土「门卡工-JllHrT'T'bZ-TjJHH桐j灰.淳体g个体达出1131向,f『IIJ」也不卜U「由y酬]小|£」一『「岭5女的IMJ理.当『日安扣iHX■蛔竽女I女H・J・|岫-眉星利1|山自句; ]应书」从电if本寸|—'次」工土度J1HHX户g,山,由h+的」-中格I仃哙&[攵的:为样本口寸.我ti*r3f1C;'>。个1P杂匚门蛤女用t不中HIEJ'.1由*不和':地月行-/次广门宦小1|¥学”]寸丁'.左「1~«呼『行』山小『.华4北白打.君单4伊J&II+从H也中扣1百乂200名学生港行酰MK用电I,内晒皮,刀I5W12S的f检帕月斤■?「'产r.1'内名单*优星限5;/欠才。4TMMih+T和-rii.w.、;我仃〔二匕如ii似闻e初t.l工』山『|,/.e统中邙jr?『仃学门"少总干军小曰4.铉」听学4r立J即彳丁㈤上物HEJk中3优乩虫/:」由中『I在J」山拜和.N.均施衣;坳仙人工率743%江说」「蛙生1沟皿田八工.•七J也描•金胡:敏孙心1L彳了1川,口的小F徐LX敌止£©,七个效,也碗:为光型{、产,与融“3句介[他门 生吐徵犷国中JMFj蜿廿J它呈先用与用i右数仙.进行力II总,燃后进行平均,在均仙中所电数皿都力所体现.1^1Ifu,我外:说均值空架中超势皿主要的测at值.,3.散点图等:航点图是在坐标系中.用X轴表示自变量人用丫袖表示一I川空:堂v,而变卅faUx,G则用坐标釜山的启表于,不]司的变好in在坐标系中形成不M的快点.用坐麻示凌.工聿标家中的散点形战的.:维图就是物点图口取点图是描述理量关系的--种"现方法,从忸点图中直现的君山叫个变AE之「司星3存在相关关墓.是1已缝件相关还是仇线性相关,也可以大致看出变量之间关系强度如何,但是对于具体关率强度则而蟹相关率数来判断口由抽样分布的1抽样分47是用杵本知EiI』Mr概F蒙分而.它此柞中其选EM容m为n的样本H寸,||7¥个样本计外;山・泯的交充口川七数作£的杆1/1喇1纨0作|二伸J如比牛本均慎的分布丁样不比倬」分加第一施无屈晓与替摭假设密,可寻常;兴W过卡平本土七段外推园门III遍见「J古的布『四松为人旭元巾工说:.四」也为赭iHM也上戊行誓刑三检,司T*J口"“表示-切|!41墟L无1俄境不戏立. f门就t4:组JMAi侬设.而媒仆用个一假设中进行选择*这就是W换假设*甘控假他血帮HI”,比小aI」力I伊「广"L康尢"品设为:,"□一1方UC榨映。品设丸t凡;1次Qt>ric;的普蛔£任用四I0分.共30分5等跑分组和不等距分组布什么区另仃诘举例说明°答:在分组II寸,如果分组组星巨和好,就空好星巨分组,如:学生平均打天上网II寸网二组距设3,分或;3-6*6-9.9-12+1£-15」七4个小组4如见分飘近距不和辫h就是不管睥分组.如:人U分析,分蛰幼儿组<0-6>T少儿和<7-17^,中青年封|<18-59^,君人蛆<60-L30>,到距不+H喏-徜迷定类变堡、定序变±±和数值型变革集中始势测斑的方法,定序变量是层次质低的变量、用众致作为其中心趋势的测量.定序变量生要使用中位一般.四分位载作为集中挺势的涮最,同时也可以使用众数作为测量值,但是中位数和四分数位利用序次关系,阻而更多使用这两者-数值型数据f定跑和定比数提)的集中趋垮涮量指标是平均数,同样.数值.型数据可以使用众铳和中位数、四分位数作为中心经势的测量.但是更主要的是使用均值,因为均值使闱所有数据信息运」I」以「在格晚叨足炎嗓1Mr巫疗变"!:和数代型艇显集中均势测九七的装父训为中史央线必:在人数拉:苏女伯市玄M・;JU3H1lrl<jiu&ilII;众玻F|।付敬00<>$"效,11*工地4蚊仆W%牧4线3.如1节,1对加;时作亦进彳」।检^^■/ U,I-2料,金/红:我门生如*Td弋闻HrIMl验I> 干子小r检举i心京上工fl/网-*下水位脸-I-.•鸣此归|的『孑:「打向处阳山熄i式依t&ii果2,社白■北异.内41检脸CPkiired-SacnpleTL«t>JI)J-|:片「殊|闪个用「丝曰”「和t.hlajft•.小J―中A.较「IJtfr用IiFJ3grKr,Cif趋,i网闺1例-*r地:义寸杵密鸣4口I」,以『F母.[上.骅.||||西个卡誓本?4个时屈本H「rJ邙值.号3—•恰珊次用律HKJ均在[品炉内4.丹地制仃安近「*<LJIJ/i-tfr^的曾GTImJU内,■说EJM十样木均梢VI:豺■主伯NG水T。卜:泓iTM异;nuj力,i./1•:豺4,占:40x「可口卡卜,蜕।w,西个才不小工々於r:C:*是i隼j,«d方水,产.I-.rr外片.■:2.>利1|」SPSS迂Lf「杵己上」.*下.+L椅!的打「SPSS卜累巾通,I,人UJ0XU--><.<>1rtpEiveM<SMna—;--i^ftired—Samplc'i''ItHt■ ■■ a丽■,」■.由1ia“Faired+h:।F'『」世JFLfl:乂r咛下和〒仝m,.<2,:;止J正中」IHF见.ftf松脸IflW网十,Tt于lj,'RaiiiVtiriMHlLrsF,4引入#VHL门灯"ViiriiiBlel*h相I""VilrishiciNE|'■ #:."CumeTitSelectioTiK'*本”.叶,*觉■^1?.bii"t'iTfiJlit11rOS)央i尔,J-capriont"也皿""I川-0-11LT「ZK'产柏1制良:层占口'内整?T.,L<S'T'村小r45554.UU、七I好邀工"侬l5分,Jt30^y>I.某大学针对黑项皿僚的杳段调疝,倒I机4I【电L3。口名破诩M将.丁硒对政篮的视点,曲:森纳贝.见表I所打,,£15分1*I,乒事中雌曲胆的演1暨给雅幸十的卬学校做片「『LIV.卜・」右g5T]旧■A口反知34-国1口口3F,),鱼232»813了事令门」上7Imw3934»迪主:「1力利」I」II蜡:赳州抬冷田■今出骷一乘斑. 在:uirn否।峰更捕以同女遍叩2L21MpL-i17f,时进:ST2明杵=利基取■颠题匣的例置CS3R515女仆让而中段以~T^4$工百中354DTS专札卜34二1共和&以上54工工Tft合一J47■15H&三2.某汽车牛产面欲广取广•吉出J目。万6口对销铐量工辆3的影响口收集」■■过去IN年的有关数据,通过分析得刎;方程的旅距为363.["fM]系数为1.42,回史I平灯和与占艮=1606歹及差邛方和WSHR5CI.要求:<1>7出俏售Kty”广*;与裁JIJ乂之间的线性回JH方程,,y-363+l.42xC3假如明年计划投入广告费用为25万元,根据回归方程怙计明年汽车销化m.当X-25¥=363+1.42*25-398,5f辆)(3^计算划定新致.并伸正官的.意义“工= =KSSR+SSE―1600+(160D+4?D)=0.78表明在商品销售量■的总变差中,有7号可以由回归方程解祥,说明回归方程的拟合程度较好.形考任务4(占比20%)学习完1-12章所有内容后,你可以完成本次形考任务了,本次任务的题型包含:单项选择题(10道),名词解释(4道),简答题(3道),计算题(2道),本次任务按照百分制计,占形成性考核总成绩的20%。一.单 皿C/|计也作1抵选番::■宅中nR有■呼是1=5的.脑焉正庭州案g阡号.岫W标逾中用举号内.和小逾之处-'.20]-见树.■&体型依航L岳分为不丹的娶安]山”」选,趣AI/普-t■关注中朱」」制miHZHL归if!田奉登曲||1¥11933+*双广H蜃:・设47椅所蕾r广TT牢白'Jj!相作/◎用餐送丘的4fM卞■」.弋称比<■□J»一箍单硒串LzWl什H察毓柏杵(7.整I拜」由杵13.分WJ*理3.F胸就分G击”—*—4、m中兹据千饯Jrq,ft?4兹的Lt枷体比tAJ铺率筠炫U领旃:d蚊前3_我白名同学r世G的给.PfFKE筋Z*brh?、幻■-8rS3.90.BJrg±r』匕幺iSjJfelE盯试」/领帕・:|=|*,工般JE<J3JA.S6K-. 7~Td-3A-E自-4-弗st法比表明.与-fu京切小大小gifJt^e 2注后在国之内上共由re>A.5gMiTffit砧B--现阴讷她臭(<?."5%的制:JKn. 班5,珈**灯也1VSSE>反映「尸国免空养中<B1A-由于h与t之向的均隹M肃小制的了09%死■邮舛耳一降J*的y的现有能由之于卜讷立旭闰素时隼变差m期响C.ih手工写y之冏金巾:殴性犬奉号|庭■幽.的安死ST分D.Ill于X,尸[raj帕两/注拒曰[呈的y幅筌4t邺令6_JME时吮”■就妙折盘是门口二郎!1任明&一洋.粒AME塞4t・下刑喷月,疔法地仃/Hrt?A.回归分析白一方皓分桁jk<tr性骏口一Ml点亲玷析iiin*凯田g的坦也团.t配旧区何.作为白任孥敢帕,门卜.法种上也呼为匚日」A.,■.'.■:(ftl|-1Hg生计C.科至t号T甘m需的M:l导-在低谯枝脸4,出:汨偎港利桥岸1工设《c>A-鄢有耳唯博立凡都¥」,他岫立J4门|曰灯小矶七D.费抨畏载主应立,由尤黑粒不定礴立引仃华玲跖的目的息「D】a-苴粒不同总件晌e*整小相等日-利嘴白卬心苦存在方差心-小树齐样本物据之阿基杳存出出着着异口.小窕寻分樊岗空M对较世理因年融的出峭总声般著】弧国勺置业MIM方彩中E合优r生的嫌计用打器星(D、A-棚共器数"出由县敷C-l"UlSft0月塞市较■..名词蚪拌二母器h»・n己。"二I-捅率■抽样著*他+林栉就/按胤防机原闵进打的扯作一地体下好个个冲也有一定

薛「普笔版料*入地梯小井H又4样小幅幅率婶星上如的④?'|」:|萨的.也插:崎华Hi机拙杆r用统抽料.为「£利|卡.怅(Tzhli广、戴向黑:聃样.2..WSF■士T年不足•--f'?vrJtniiMl .匕;册/丁加利■牛不过S口白勺而*J"怎?■你UMMTTJ本JUli寻丁汴」•次7》1而1同,▼在U列1.4地仃」上仃天」.姓£:看了『1人1|甘早-产^~ [:3k”目、&>庇再卤■,铮-:产,Pk四•4..■赫*黄’•id•排G0>1立下弋而?学.M-Mg水平■h 台木干砒足¥1•悔J愁i:置昨rug少理币:"1M存次.留值EQ1包WX3H小纶型m但g际锻磨『i'.ri9।•匕也|.j.感的奉mJt一用钱-陪『f标邓塞与St*W.蚣-UK均附.土比r步余汨交m系敝■手.犯R、工件卡1f於己KJ+千本NF,对#驻哈二是拈-一个■+本本中时欲短■与国-一十小『*中时*-幅•4t?刘应附两个碎水可土立杵不;是才占视立丁彳小母*Jg杵率,总件W「可是的耳3公立院1.■<,崎?V圈t父幽I。分n共型、分」।.1笈**j立水”4-二出IeLiu分AjipurjL一龙丫■>[<悝|]GE」"」-按期加虎,水平.变量•可以分为直:卖定好.定可变哥,.忘距变身料法LH衣与E;生.(11定*变量;当唯恻曲.g含义仪枭布十4聚屿不同非别*加不掂■.明个侔的人石、-追成等联■仲,特皆HM.瑞14+窕贵帝士为星共变卡一分舞农>1■星能fEfc屋次的青卡-..例如性加可以分为力.去两突.(2?定序变贤l当变贤例碑含义不仅苹z示个件妁不同类别汪fl以区分个佯之何大小r程度等序次差:界廿九运科交道和为定厅变H.受粮角隹度是定疔喳岸.可以分为文盲:小学初中.喜中“六心」段以上等.工走踞变百二步理量值不仅可以楮个体区分为不间奏阻并蛙行第R月「而且f"例定不「词类另"-七问稣数最差别和同朋至距日”这寸芋的变量橘二方定距变量r定距莅鬓串J.有涮量弹召J运连法!1里一单位旦有千支的才日笠匹同的持谁.使个侔之I司屿比较肥具碎现性a右两.温度等阊1■息定距变量、(,。道:生变恬:除了上述三种变更7的全邰色翅身卜,T正可一以十户算两个变盘油.一之|可的]:七馁.时n送主丰的赫封村工为定上11变.M.定比变阜是最.图层次的黄量*/一社不隔士中-眼弄情况."F拉归使用咕部是定比嚏苛、倒如T网商”年龄、收入「一个岫区的人口钱..某产晶妁生产学一等.2,奉珈1帮1耍晓1!^*k金砧『好Jt±,n一本系统.先始s杜会硒充通电避湖卷比赦住r定的过程,股包.括一五个二一驾且招彳提出间陶;小成.俄设L;妆笑救坪:分机毅整二任」隆假C15提iH『可期是社会切•死的第一-生+初痛者应首先明确更做干i■么.就者睨逊行刊究&V目的是ft么.C2>可究问题社拄晶_无法直操检曜啊,而是吉巴矶充问题形成假设才可进千亍棒淞+假挈:是对两个变学「可关寿的降述,房网亡61关赛的聋试性国智F假设中的重量星:相对总体的,是可以通过松脸可测的.t3)映集徵据是%L会研■究为关键步锋u送一阶段要确定败.朱的安贽,恢集的方法.收条的总第•等.送一阶包所需设入的人力、的力量承,遏驯的阿甄也最要,因而需忍琏行很女十的短织和哲理..(4了分析数据主更是对收集的序好■眼揖进行乘倏一的审才立•整理r归类.蜕计粕分析.找忙K要进行翅逑性统计,说明蜴姆的思d行情况「又•普进行推断性统计,从收集咕样-木状羽.来推断初究总体集rW丸况.£51先渥对数据的垃计分析后.我们要根埠对毅据的分析来检验我俏之前的假食和理一堆.当结果支捋我忙I的假谀后、投们对朝7充问题洱网了解释:当结亮不支持程们的假《殳时■.噱回过头来修改盹优)的问迪和便改,开蛤新的一轮私驰。*江线忤回归根甥1・卜,唧g就小假定1一帙她-本作一五L班性.回归分牺过不恰中,回归分析是徒士一定刑偎设技硒上的,达当慎设身:(1*一回归樵犯因变量V与向变量.*上向月■-布,冬力生片系-<21.畦事zWS才±T才芋中自焚垢X律f.是国定的.HU像定车篷非隔机的.<3>rI於提:哂的均俳一为零.T41.%就喳的方养为布畋一(3、.但举期*LW女正值ML重量W一月及从正右分布,RK妾种描蜘周5■是举fL".上假设;从而确保■炉J归模步1的士施性. a西,14-rtiS口皿题156>,J',30 )I.出打加《中"用.斯小刀「皿4G个命力上2口1I4|•,产:JLfri宣诉庆飒』川川卜一历■力,祀十企业工命”年产用宝有/姆地命rQk办酒玄冉甘?翔ymq忱我召9锌3t±?m企”忖汩夕的生革!让正,1也盘酒俏伊鞫社115之111BJ5211.C3U3]]与口N103121N3NN1321-40311713116231.3733]27407141132白L善区34\3S51241511O35q135117石11Q16115261IS3611371。因171.OO2712037104K*其1区S728I123«]259129191.C3729-53910梏1O11520119301424012G联求:=<I)<J201L与■钓时剜H支II1低刎前边力TFJ卞.二上出众涮.中@数和■'产均蛙O音:值也割Ll"f氏同用排列2S7>SEr91、95、97-1口口、IQ3103,.10-4■1<)4.】8■1,icm.11】12■1IBv115.115.J1I&r117,11”11.8v119,11年1_20.123v124,126%127x12中工13"136xfl3下,13片口142、1总桁X132;众数:I15:n11h/.Sic,: (l]5I]1GJ/2—115.5,平」句数ux=(x:+xLi+xM-jcH>/hl=<87-1-68+91-i^&6+ 卜14心卜J.5Z2)//。=;(337/鼻。=1」6■一I7~i

O如田:』.女]同又见止.有勺中。陋[产:1=5"匕犷」为;匕是1斤?、1上.i1S7/-125万上色」rrj■为限物「七》、”■口口与i^jjr««iii-^j>,j ->wt住H".I*:5以J--g.g去/T企rlk■-匚月;玄:垄Mk.、LNQ.小生rW、 T15t9业.,1二生qkjit彳r/J-打I.,喻:和」刎•修/丁加,4TJHi■•卜丘外铛出门皿下I小石!地页•午工物钠gF分也如曾'EI成1上字一彳咒.向1・.积刑i*CAI蝴*k物王<%?105万无以T'322.5%Q22,5%401OWJ4105―115万无S2Cfflh1742.5%3177.5%115—1125万123口X2。72.5%23S7,丐K12S尸于元以_t-1127=S%事(J1。。餐112-7,5%2. 5生ifM冢.2丽显在向匚占『因J,一年9JI1«招'4」[七解'口卅打七'.y?门勺土”沟.收』M:广日心12ufl/j白-*蚪洞,;-jJU121--^>+JrS?iJliA'K^i'iJ+!=iZr土分由片声<JFMS-尸&i氏回归I-502708.6r>Forooo淞差4Q15R.OACF——魁WAL1———要求:<1>计算卜而右罡分析表中A.R、C.口、匕、厂处的侑口,:A=]&LI27OJ4S+4OI5W.OW=I54^S66.6S(SS|川!H+S5赛量上B-1.C=11-1=10£总”-B。D=IM工了。H_aH=IG□上7OH..6pF40158.OS/C4OL5.S08;F=l>/E=l6O27rtK,^A4<l15SOS=1Q9C>相晶钠小量的交差中,多少是由广告费用的差异引起阳丁答:,VA7,l6f)27OX.tS答:,VA7,l6f)27OX.tSLfi42H6(5.6«(.J.V75<><3>销售电七L与黄用上司的杵I夫系熟是多少■号r=Jh'—JrnkM—O.UKT?钙转量与广告费用之I可的相关系数为;69S77,网上学习行为(占比20%)辅导教师根据学生到课情况、参与讨论、发言情况(包括课堂和网络)、按时提交作业情况、学习活动完成情况等,对学生学习情况进行综合评价,在第18周完成。占课程综合成绩的20%,按百分制计算。分隔小组:所有成员。作业3一、单项选择题(每题2分,共20分).某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于(系统抽样)。.以下关于因变量与自变量的表述不正确的是(自变量的变化是以因变量的变化为前提).某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据(线图)。.以下关于条形图的表述,不正确的是(条形图的矩形通常是紧密排列的).某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生(数学的成绩考得更好。.有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下甲、乙两人打靶的稳定性水平表述正确的是(甲的离散程度小,稳定性水平高).下表是某单位工作人员年龄分布表,该组数据的中位数出现在第(第5组)组。组别按年龄分组(岁)工作人员数(人)120~246225~2914330~3424435~3918540~4412645~4918750~5414855~596合计112.对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间(相关程度越小).回归平方和(SSR)反映了y的总变差中(由于x与y之间的线性关系引起的y的变化部分).下列哪种情况不适合用方差分析(年龄对收入的影响)

二、名词解释(每题5分,共20分).非概率抽样:根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。.二维表:二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表.置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例.卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布三、简答题(每题10分,共30分).等距分组和不等距分组有什么区别?请举例说明(1)定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其它特征时,这种变量称为定类变量。(2分)例如:性别(2)定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定序变量。(2分)例如:学历(3)定距变量:当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同类别之间的数量差别和间隔差距时,这样的变量称为定距变量。(2分)例如:智商(4)定比变量:除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的变量称为定比变量。(2分)例如:收入..简述相关系数的取值与意义相关系数的取值在-1~1之间(2分);相关系数的正负号表示两个变量相关关系的方向,“+”表示正相关,“-”表示负相关(2分);相关系数的绝对值表示相关关系的程度,绝对值越大,相关程度越大,即r越接近1(2分);反之,绝对值越小,及r越接近0,相关程度越弱(2分);相关系数r=0时,只能说变量之间不存在线性相关,而不能说它们之间不相关.简述什么是简单回归分析?其作用是什么(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。(2)回归分析的作用包括:①从已知数据出发,确定变量之间的数学关系式;②对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变量;③利用所求出的关系式,根据一个变量或多个变量的取值估计或预测另一个特定变量的取值。四、计算题(共30分)1.一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克;女生的平均体重为50千克,标准差为5千克。请问:(1)是男生体重差异大还是女生体重差异大?为什么?(2)男生中有多少比重的人体重在55千克-65千克之间?(3)女生中有多少比重的人体重在40千克-60千克之间?备注:中(1)=0.8413,中(2)=0.9772

5 Sh5va=——=—=0.083 丫女二—二一=0.1-760 ㈠分)七50 ㈠分)’里小如,所以女生体重差异比男生大口(1分)⑵P(55<X<65^=由[(65-60)/5]一曲[(55-60)/5]二小⑴一小(-1)二由(1)-[l-(b(-1)]二2小(1)-1(3分)由题得,巾(1)=0.附13,所以2也(1)-1=0.6826,即6飕的男生体重在55千克-65千克之间)口分)(3)P<55<X<65)=中[(6A-50)/5]一&[(40-50)/5]二小(2)—由(-2)二巾(2)-[1-d)(-2)]=2&⑵-113分)由题得,0>(2)=0.9772,所以2小⑵一『0.9544,954的女生体重在如千克-60千克之间。(1分)2.为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。通过分析得到以下方差分析表:MS F Sig.D F 0.000E — —MS F Sig.D F 0.000E — —回归 1602708.6B残差 40158.08C总计 A 11 — — —要求:SSR1602708.6…「 = =0.9756SST1642866,68(1)计算上面方差分析表中A、B、SSR1602708.6…「 = =0.9756SST1642866,68变差来源SSdf照F区Jr回归1602708,611602708.6399.10,000残差40158.08104015.808■————总计1642866.6811— ——(2)商品销售量的变差中有多少是由价格的差异引起的?R2=即商品销售量的变差中有9736%是由广告费用引起的.(3分)

作业4一、单项选择题(每题2分,共20分).以下关于因变量与自变量的表述不正确的是(自变量是引起其他变量变化的变量).某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为(5.5小时).以下关于条形图的表述,不正确的是(条形图的矩形通常是紧密排列的).下表是某单位工作人员年龄分布表,该组数据的中位数出现在第(第5组)组组别按年龄分组(岁)工作人员数(人)120~246225~2914330~3424435~3918540~4412645~4918750~5414855~596合计112.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生(数学的成绩考得更好。.在假设检验中,不拒绝虚无假设意味着(没有证据证明虚无假设是错误的).根据一个样本均值求出的90%的置信区间表明(总体均值有90%的概率会落入该区间内).在回归方程中,若回归系数等于0,这表明(自变量x对因变量y的影响是不显著的).中心极限定理认为不论总体分布是否服从正态分布,从均值为八方差为02的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n>30),样本均值的抽样分布近似服从均值为(U)、方差为(02/n)的正态分布。.下列哪种情况不适合用方差分析(年龄对收入的影响)二、名词解释(每题5分,共20分).整群抽样:先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取一些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。.Z值:Z值又称为标准分数,它是以平均数为参照点,以标准差为单位的描述原始数据在总体中相对位置的量数,通过计算Z值将一般正态分布转换为标准正态分布,Z值的计算公式为:Z=(X-p)/o.二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。.误差减少比例:在预测变量Y的值时,知道变量X的值时所减少的误差(一)与总误差的比值称为误差减少比例,简称PRE。

三、简答题(每题10分,共30分).判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。(1)网络供应商的姓名(2)每月的网络服务费(3)每月上网时间(4)上网的目的(5)上月网购次数判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。(1)网络供应商的姓名:定性(2分)(2)每月的网络服务费:定量、连续变量(2分)(3)每月上网时间:定量、连续变量(2分)(4)上网的目的:定性(2分)(5)上月网购次数:定量、离散变量(2分).简述什么是简单回归分析?其作用是什么?(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。(2)回归分析的作用包括:①从已知数据出发,确定变量之间的数学关系式;②对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变量;.如何对配对样本进行t检验。配对样本检验主要是判断不同的处理或试验结果是否有差异。配对样本的t检验用于检验两个相关的样本是否来自具有相同均值的总体。在对配对样本进行t检验时,首先计算两个样本中每个对应变量之间的差值;然后再检验其差值的均值是否为零,如果差值的均值接近零(在给定的置信区间内),说明两个总体均值在给定的置信水平上没有差异,如果差值的均值在置信区间外,则说明两个总体均值在给定的置信水平上有差异。四、计算题(共30分)1-为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。(1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。注:Z0.025=1.96.(1)已知:仃二225,.(1)已知:仃二225,工二63产2.5,Z=L96 (2分)=6,5+033(4分)0.025用户每天平均用水量的95%的置信区间为:所以,网络用户每天平均上网时间的置信区间为〈6.17,6.83),(2分)(2)样本比例:P=曳=0.4 (2分)225小主为女性的家庭比例的9萧的置信一区间为:P±Z广J产°一尸)=04±1%xJ04X011=0.4±0064(3分)跖Y疗 1 225所以,年的在20岁以下的网络用户比例的置信区为(33.6%,46.4%)(2分)2.某农科院使用4种方法培育稻米,为确定哪种方法生产效率最高,随机划出40块试验田,并指定每块试验田使用其中的一种方法。通过对每块试验田的产量进行分析得到下面的方差分析表。请完成方差分析表。变差来源SSdfMSFSig.组间AC320F0.000组内6048DE总计B39960C3分兄7008<2分、、3(3分,36(2分,16B<3分),1,90<2分)变差来源SSdrMSFSi.E组向96033201.90a000组内604836L6S———总700339————.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。这种调查方法属于(分层抽样)。.以下关于因变量与自变量的表述不正确的是(自变量的变化是以因变量的变化为前提)。.为了解某地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。此处5000户是(样本)。.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于(系统抽样)。

.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为(5.5小时)。.下表为某专业一年级学生平均每周上网时间的频率分布表,按照向上累积的方法计算第5组的累积频率是(66.1%)。组别按年龄分组(岁)工作人员数(人)120~246225~2914330~3424435~3918540~4412645~4918750~5414855~596合计112.以下关于条形图的表述,不正确的是(条形图的矩形通常是紧密排列的).下表是某单位工作人员年龄分布表,该单位工作人员的平均年龄是(39)。组别按年龄分组(岁)工作人员数(人)120~246225~2914330~3424435~3918540~4412645~4918750~5414855~596合计112.依据上表,该单位工作人员的年龄众数出现在第(第4)组。.对于左偏分布,平均数、中位数和众数之间的关系是(中位数〉平均数>众数,众数〉中位数>平均数)。.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于(系统抽样)。.甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,

标准差为3,以下关于甲、乙两人打靶的稳定性水平表述正确的是(甲的离散程度小,稳定性水平高)。.社会工作一班男生的平均体重为55千克,社会工作二班男生的平均体重为52千克,两个班级男生体重的标准差均为5千克,那么(二班学生体重的离散程度大)。.在标准正态分布中,o值越小,则(离散趋势越小)。.某班级学生期末统计学考试平均成绩为82分,标准差为5分。如果已知这个班学生的考试分数服从正态分布,可以判断成绩在72-92之间的学生大约占全班学生的(95%)。.中心极限定理认为不论总体分布是否服从正态分布,从均值为小方差为02的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n230),样本均值的抽样分布近似服从均值为⑺)、方差为(02/n)的正态分布。.在假设检验中,不拒绝虚无假设意味着(没有证据证明虚无假设是错误的)。.对消费的回归分析中,学历、年龄、性别、收入都是自变量,其中收入的回归系数为2.8,这表明(收入每增加1元,消费增加2.8元)。.回归平方和(SSR)反映了y的总变差中(由于x与y之间的线性关系引起的y的变化部分).在回归方程中,若回归系数等于0,这表明(自变量x对因变量y的影响是不显著的)。.下列哪种情况不适合用方差分析(年龄对收入的影响)。.从两个总体中共选取了8个观察值,得到组间平方和为432,组内平方和为426,则组间均方和组内均方分别为(432,71)。.随机现象就是在同一组条件下,每次试验可能出现某一结果,也可能不出现,也就偶然现象。.总体与样本一般地,把所研究对象的全体元素组成的集合称为总体(或称母体),而把组成总体的每个元素成为称为个体。为了了解总体X的分布规律或某些特征,必须对总体进行抽样观察,即从总体中,随机抽取个个体,,…,,记为,并称此为来自总体的容量为的样本。.参数与统计量:参数(parameter)是研究者想要了解的总体的某种特征值。统计量(statistic)是根据样本数据计算出来的一个量。.抽样分布:抽样分布是指样本统计量的概率分布,它是在重复选取容量为n的样本时,由每个样本计算出来的统计量数值的相对频数分布。.置信水平(confidencelevel)就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。.置信区间(confidenceinterval)是在区间估计中,由样本统计量所构造的总体参数的估计区间,它有估计量加减抽样误差构成,我们将区间的最小值称为置信下限,区间的最大值称为置信上限。等距分组和不等距分组有什么区别?请举例说明。

(1)在对数据进行分组时,如果各组组距相等,则称为等距分组。例如,分析某班同学期末统计课成绩时,假如最低分为73分,最高分为98分,以5分为组距进行分组,分为70-75分,75-80分,80-85分,85-90分,90-95分,95-100分。(2)如果各组组距不相等,则称为不等距分组。例如,在分析人口时,往往将人口分为婴幼儿组(0-6岁),少年儿童组(7-17岁),中青年组(18-59岁),老年人组(60岁及以上),该分类中各组组距不相等,这就是不等距分组简要说明卡方的拟合优度检验和独立性检验的含义。(1)X2检验用于分类变量之间关系的检验。当用于检验不同类别的目标量之间是否存在显著差异时,称为拟合优度检验。例如,不同职业的人群中对某项改革措施的支持率是否一致。(2)X2检验还可用于判断两个分类变量之间是否存在联系。如果两个分类变量之间没有关系,则称为独立,我们用X2判断它们之间是否关联,这时称为独立性检验。例如,对性行为的态度是否与受教育程度有关。简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区别。分析双变量关系时,t检验和卡方检验都是主要用于检验这两个变量之间是否存在显著关系。t检验主要用于对一个为数值型变量、另一个为分类变量且只有两个类别的变量的双变量关系的统计显著性检验。卡方检验主要用于对两个分类变量之间的相关性进行统计检验,判断变量之间是否存在显著关系。例如,我们想考察收入与性别是否存在关系,或者两性的收入是否存在显著差异,可以用两独立样本t检验。如果我们想考察职业与性别是否存在关系,而职业和性别都是分类变量,那么可以用卡方检验考察不同性别之间职业是否存在显著差异。某行业管理局所属40个企业2011年产品销售额数据如下所示。40个企业2011年产品销售额企业编号销售额企业编号销售额企业编号销售额企业编号销售额1152111052110331136210512123221033214631171311623137331274971411524138341355124151102591351176119161152611836113710817100271203710488818872811238125912919107299539108

10 115 20 119 30 142 40 126要求:(1)对2011年销售额按由低到高进行排序,求出众数、中位数和平均数。(2)如果按照规定,销售额在125万元以上的为先进企业,115万-125万之间的为良好企业,105万-115万之间的为一般企业,105万以下的为落后企业,请按先进企业、良好企业、一般企业、落后企业进行分组,编制频数分布表,并计算累积频数和累积频率。(1)销售额由低到高排序:(5分)87、88、91、95、97、100、103、103、104、105、105、107、108、108、110、112、113、115、115、115、116、117、117、118、119、119、120、123、124、125、126、127、129、135、136、137、138、142、146、152众数:115(1分)中位数:115.5(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论