已阅读5页,还剩25页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
湖北师范学院2012届数学与统计学院学士学位论文毕业(设计)学号08111030441编号研究类型应用研究分类号 HUBEI NORMAL UNIVERSITY学士学位论文Bachelors Thesis 论文题目影响老年人服装消费因素的分析作者姓名曾梦玲指导教师江秉华所在院系数学与统计学院专业名称统计学完成时间2012.5.8湖北师范学院学士学位论文(设计)诚信承诺书中文题目: 影响老年人服装消费因素的分析外文题目: Effect of elderly clothing consumption factors analysis学生姓名曾梦玲学 号2008111030441院系专业数学与统计学院统计学班 级0804学 生 承 诺我承诺在毕业论文(设计)活动中遵守学校有关规定,恪守学术规范,本人毕业论文(设计)内容除特别注明和引用外,均为本人观点,不存在剽窃、抄袭他人学术成果,伪造、篡改实验数据的情况。如有违规行为,我愿承担一切责任,接受学校的处理。 学生(签名):2012年5月12日 指导教师承诺我承诺在指导学生毕业论文(设计)活动中遵守学校有关规定,恪守学术规范,经过本人核查,该生毕业论文(设计)内容除特别注明和引用外,均为该生本人观点,不存在剽窃、抄袭他人学术成果,伪造、篡改实验数据的现象。 指导教师(签名): 2012年5月12日影响老年人服装消费因素的分析 曾梦玲(指导老师:江秉华)(湖北师范学院数学与统计学院 统计学 0703班 湖北黄石 435002)摘要:采用问卷调查的方式,调查荆门市60岁以上老年人的个人信息,包括文化程度、职业、月收入、每年中用于服装的花费等,从影响老年人选择服装的年龄因子、职位因子、收入因子、每年开销因子、风格因子、面料因子、色彩因子、档次因子8个因子入手进行统计分析。最终得出结论:在影响老年人服装消费的各种指标中,由回归分析表明,年龄因子,收入因子,和服装风格因子之间存在线性关系。在主分量分析中,第一主分量是服装风格因子,第二主分量是收入因子,第三主分量因子是年龄因子。我们可以推断荆门市的老年人在服装消费是最主要比较看重服装的风格,其次与自己的收入与年龄也有很大关系。分析结果与实际也很吻合。说明主成分分析法用的非常好。关键字:逐步回归分析 主成分分析 服装消费 Effect of elderly clothing consumption factors analysis ZengMengLing (Tutor: JiangBingHua )(Department of mathematics and statistics,Hubei Normal University , 435002)Abstract: Adopting questionnaire survey, investigation of Jingmen City, the elderly over the age of 60 personal information, including education, occupation, income, every year for clothing expense. From the effect of older age factor, the choice of clothing position factor, income factor, cost factor, each style factor, fabric , color factor, quality factor 8 factor proceed with statistical analysis. Final conclusion: The effects of elderly clothing consumption of various indicators, by regression analysis shows that, age factor, income factor, and there is a linear relationship between the clothing style factor. The principal component analysis, the first principal component is the clothing style factor ,The second principal component is income factor, the third principal component factor is age factor. We can infer from the older people in Jingmen city garment consumption is the leading pay more attention to the clothing style. Secondly, with their income and age also has the very big relations. The analysis results and the actual anastomosis.Key words: stepwise regression principal component analysis garment consumption 影响老年人服装消费因素的分析 曾梦玲(指导老师:江秉华)(湖北师范学院数学与统计学院 统计学 0703班 湖北黄石 435002) 1、研究背景我国老年市场潜力巨大,根据我国国家统计局第六次人口普查结果显示:全国总人口为 1339724852 人,60 岁及以上人口占 13.26%,比 2000 年人口普查上升 2.93 个预测百分点,其中 65 岁及以上人口占 8.87%,比 2000 年人口普查上升1.91 个百分点。据,2030 年我国 60 岁以上老年人将达到 3.1 亿,占全国总人口比例的 20.42%。到 2050 年,60 岁以上老年人数量将达到 4.68 亿(其中 80 岁以上人口数达 1 亿左右),占人口总数的 27.71%。早在1999 年,我国就已步入老龄化社会,当时企业界和理论界均认为我国的老年市场亟待开发、老年产业潜力巨大,但大部分企业却不敢轻易涉足老年产业。到市场上逛逛服装商店,人们就会发现这样一种现象:俊男俏女的服装,花红蓝绿的儿童服装比比皆是,而想买件老年人服装却是十分困难的事。寻找专卖老年人服装的商店更是困难。从市场经营的规律来讲,凡是市场上短缺东西,就是一个财富信号, 就是一个潜力,就是一次机遇。所以,这种现状应当引起商家的重视。但是商家如何将老年人服装市场的潜力挖掘出来,这就需要好好的对老年人对服装许许多多方面做出思考。本文就将问卷调查结果,从影响老年人选择服装的年龄因子、职位因子、收入因子、每年开销因子、风格因子、面料因子、色彩因子、档次因子8个因子入手进行统计分析。通过对这些因子的分析找出老年人服装受影响的主要因子,最终使得商家能设计出更有利于市场的老年服饰。2、调查内容、对象与方法2.1 调查内容与方法采用问卷调查的方式,调查内容是老年人的个人信息,包括文化程度、职业、月收入、每年中用于服装的花费等;除了个别问题采用开放式的形式,请调查对象自由作答以外,绝大部分的问题采用封闭式的形式。2.2 调查对象调查对象为荆门市60 岁以上的老年人。将问卷设计出来后于 2012 年2月进行了试调查,以测定调查对象对于问卷的理解程度。然后利用暑假回家的机会对他们周围的 60 岁以上的老年人进行调查的方式,于 2012 年 23月进行了调查。共发放调查问卷 100 份,收回 98 份,除去回答不符合要求或不完整的问卷 2份,对 98 份有效问卷进行了统计分析,有效应答率为 98%。调查对象的月收入和每年用于服装的花费以及职业和文化程度情况统计见附录。调查结束后,以有效样本结果进行分析,并运用 SPSS 及 Excel 软件进行整理和统计。 2.3分析方法对于封闭式问题的数据,采用社会科学统计软件包SAS9.2 进行统计分析。采用的主要分析方法为多元统计方法,对消费观念作因子分析,分析各类人群在消费观念方面的特征。主要采用聚类分析,回归分析,主成分分析等分析方法。 2、逐步回归模型建立2.1 回归分析2.1.1 逐步回归分析的基本思想同时,每一引入一个新变量,对已入选方程的老变量逐个进行检验,将经检验认为不显著的变量剔除,以保证所得自变量自己中的每个变量都是显著的,此过程仅经若干步直到不能再引入新变量为止。这时,回归方程中所有自变量对因变量都是显著的,而不在回归方程的变量对都是经验不显著的,由此可见,逐步回归法选择变量的过程包含两个基本步骤,一是从回归方程中剔除经检验不显著的变量,二是引入新变量到回归方程中。2、1、2 REG过程的功能设考察的指标(或称因变量,响应变量)为,影响这些指标的因素(或称自变量,回归变量)为。已知这些变量的次观测数据组成的一个SAS数据集。REG过程可以完成以下几方面的计算:(1) 利用具有多项选择的MODEL语句来建立用户需要的线性回归模型; (2) 提供九种选择“最佳”回归模型的方法; (3) 允许采用交互方式修改模型及用于拟合这个模型的数据; (4) 可建立线性约束回归模型; (5) 检验线性假设和多变量假设; (6) 生成原始数据和一些统计量的散点图;对散点图还有“着色”,加亮功能; (7) 产生偏回归杠杆图,并进行共线性诊断,影响诊断; (8) 可以输出预测值、残差、标准残差、置信区间的上下限和影响统计量等;并把它们存储到一个SAS数据集里; (9) 可以使用和的相关阵和离差阵作为输入数据; (10) 可以把离差阵(叉积阵)存贮到一个输出SAS数据集里,以便将来使用; (11) 在611版本,REG过程完成岭回归和不完全的主成分分析(IPC);(12) 在611版本,PROC REG语句可使用选项GRAPHICS,它使得你能够要求PLOT语句用高分辩率图形设备绘图。2、1、3选择最优回归模型方法设和的次观测数据为满足线性回归模型:.利用矩阵符号可简记为.因考察的个自变量对的作用有大有小,且自变量之间一般存在相关性。为了从与的所有可能回归模型中选出拟合这组观测数据的最优回归子集,REG过程提供了九种选择回归模型的方法,它们通过MODEL语句中的选项selection=来规定。下面介绍这些方法及其在选项SELECTION=中用于识别这些方法的关键词。1. 全回归模型(NONE)没有对回归变量进行筛选,建立与全部自变量的回归模型。这是很多回归分析使用的方法。当省略选项SELECTION=时,表示建立全回归模型。2向前法或逐步引入法(FORWARD)向前选择法的初始模型中没有变量。对每个自变量,向前法计算如果这个自变量包含在模型中它对模型贡献大小的统计量,并将这些统计量相应的值与SLENTRY=的值(用户在MODEL语句中规定的引入时的显著水平。如果没有规定,即缺省时,则用0.50比较如果所有自变量对应的统计量的显著概率(值)都大于这个值(表示所有自变量对因变量的贡献都不显著),向前选择过程结束。否则,就把具有最大值的自变量引人模型。然后对未引入模型的自变量再计算它们的的统计量,重复上述计算步骤,变量逐个被加到模型中,直到没有变量其值相应的值大于SLENTRY=的值。使用向前选择法,变量一旦选入模型,就不会被剔除。3向后法或逐步剔除法(BACKWARD)向后删除法开始对包含所有自变量的模型计算统计量, 然后从这个模型中逐个删除变量,直到在模型中的所有变量产生的统计量在这个MODEL语句里规定的选项SLSTAY=的值(如果缺省,则用0.10)水平上是显著的。在每一步,删除对模型贡献最小的变量。4.逐步筛选法(STEPWISE)逐步法是向前选择法的修正,和向前选择法的区别在于引入模型中的变量有可能被删除。像向前选择法一样,变量被逐个引入到模型中,而且对引入的变量其统计量在SLENTRY=的水平上必须是显著的。引入一个变量之后,逐步法还要检验所有已经包含在模型中的变量,并删除在SLSTAY=的水平上不显著的一切变量。仅当经过检验并把所有不显著的变量删除后,才考虑是否再引入新变量。当在模型外的所有变量在SLENTRY=的水平上都不显著,而在模型内的任一个变量的统计量在SLSTAY=的水平上都是显著时,逐步筛选过程停止。另外,若刚被删除的变量又被引人模型时,逐步筛选过程也停止。5最大增量法(MAXR)最大增量法不是确定唯一的一个模型。而是寻找“最优”一个变量模型,“最优”两个变量模型等等,但它对每种变量个数,并不能保证找到具有最大的模型。MAXR方法首先寻找具有最大的单变量模型,然后引入产生最大增量的另一变量,得到两个变量的模型后,把模型里的这些变量与不在模型里的每个变量进行比较。每次比较,MAXR方法决定是否删除一个变量并用其它变量替换来增加。在比较所有可能替换之后,MAXR进行替换使得增加最大。然后再进行比较,这个过程一直继续直到MAXR不能找到替换使增加。于是得到的两个变量模型就认为是用这个方法能够找到的“最优”两个变量模型。然后又引入变量到这模型中,重复比较和替换过程来寻找“最优”三个变量模型等等。STEPWISE方法和MAXR法的区别是MAXR法在进行替换之前计算了所有替换的情况。而STEPWISE法在剔除了“最坏”的变量后,有可能还没有顾上考虑如何引入“最好”的变量筛选过程就完成了。一般MARX法需要比STEPWISE法更多的计算时间。6最小增量法(MINR)MINR法类似于MAXR法,但替换是选择产生最小增量的那一个变量。对给定变量个数的模型,MAXR和MINR法一般都得到相同的“最优”模型,但MINR法对每种变量个数考虑更多的模型。7选择法(RSQUARE) RSQUARE法用于寻找某些自变量的子集,这些子集在给定的样本中用线性回归可以最佳地预测因变量。用户可以规定出现在子集中自变量的最大和最小个数及被选择的每种大小子集的个数。RSQUARE法可以有效地计算所有可能回归子集并在每种子集大小里按递减的次序输出这些模型。为了比较不同变量个数的子集,该方法还提供一些有用的统计量,这些统计量以及回归系数的估计可以直接打印或输出到一个SAS数据集里。 用RSQUARE方法选择的回归子集模型对于给定的样本按准则是最优的,但他们对于这个样本所抽取的总体或者你想要做预测的其它样本而言未必是最优的。如果一个子集模型是根据最大值或者用模型选择的其它一般准则建立的,在模型事先给定的假设下对那个模型计算的所有回归统计量,包括用REG计算的所有统计量都是有偏的。RSQUARE法对于研究模型的建立是一个有效的工具,但没有统计方法能够用来建立“真的”模型。实际模型的建立要求提供大量关于预测理论及关于这些模型的函数形式。RSQUARE法和其它模型选择方法的区别在于,它总能够对所考虑变量的每种变量个数找到具有最大的模型,而其它选择方法不能保证这一点。RSQUARE法比其它选择方法需要更多的计算时间,因此在考虑很多自变量的情况下,最好使用如STEPWISE等其它选择方法。8修正选择法(ADJRSQ)该方法类似于RSQUARE法,只是对于选择模型使用的准则为修正统计量。修正统计量定义为ADJRSQ=其中是用来拟合模型的观测个数,是模型中参数的个数(包括截距项),而=1(当模型包含截距 (常数项)时),否则为0。9Mallows的选择法(CP)这个方法类似于ADJRSQ,只是模型选择的准则使用Mallow提出的统计量。统计量定义为其中是全回归模型的MSE(均方误差),是包含常数项(如果存在)有个参数的模型的误差平方和。如果画对的图形,Mallows建议选择最接近的那个模型。2、1、4回归分析的步骤(1)根据预测目标,确定自变量和因变量。明确预测的具体目标,也就确定了因变量。如预测具体目标是下一年度的GDP,那么GDP为Y就是因变量。通过市场调查和查阅资料,寻找与预测目标的相关影响因素,即自变量,并从中选出主要的影响因素。 (2)建立回归预测模型。依据自变量和因变量的历史统计资料进行计算,在此基础上建立回归分析方程,即回归分析预测模型。 (3)进行相关分析。回归分析是对具有因果关系的影响因素(自变量)和预测对象(因变量)所进行的数理统计分析处理。只有当变量与因变量确实存在某种关系时,建立的回归方程才有意义。因此,作为自变量的因素与作为因变量的预测对象是否有关,相关程度如何,以及判断这种相关程度的把握性多大,就成为进行回归分析必须要解决的问题。进行相关分析,一般要求出相关关系,以相关系数的大小来判断自变量和因变量的相关的程度。 (4)检验回归预测模型,计算预测误差。回归预测模型是否可用于实际预测,取决于对回归预测模型的检验和对预测误差的计算。回归方程只有通过各种检验,且预测误差较小,才能将回归方程作为预测模型进行预测。 (5)计算并确定预测值。利用回归预测模型计算预测值,并对预测值进行综合分析,确定最后的预测值。具体计算过程用SAS软件计算,SAS程序见附录。2.2 逐步回归输出结果 The SAS System 21:24 Monday, January 5, 2009 1 The REG Procedure Model: MODEL1 Dependent Variable: YNumber of Observations Read 95 Number of Observations Used 95 Stepwise Selection: Step1 Variable x2 Entered: R-Square = 0.4129 and C(p) = 11.0579 Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr FModel 1 10378438 10378438 65.39 FIntercept 392.61037 64.59307 5863431 36.94 .0001 x2 0.22398 0.02770 10378438 65.39 F Model 2 11379623 5689811 38.05 FIntercept 112.67389 125.04857 121417 0.81 0.3699 x2 0.20343 0.02803 7874554 52.65 FModel 3 11836425 3945475 26.99 F Intercept 1114.39133 579.98279 539657 3.69 0.0578 x1 -14.94064 8.45165 456802 3.13 0.0804 x2 0.18212 0.03022 5307860 36.31 F Intercept 1114.39133 579.98279 539657 3.69 0.0578 x1 -14.94064 8.45165 456802 3.13 0.0804 x2 0.18212 0.03022 5307860 36.31 F 1 x2 1 0.4129 0.4129 11.0579 65.39 .0001 2 x7 2 0.0398 0.4527 6.1352 6.69 0.0112 3 x1 3 0.0182 0.4709 4.9766 3.13 0.0804 经过三步逐步回归检验, Variable x2 Entered: R-Square = 0.4129 and C(p) = 11.0579, Variable x7 Entered: R-Square = 0.4527 and C(p) = 6.1352, Variable x1 Entered: R-Square = 0.4709 and C(p) = 4.9766,根据均误差最小的准则,修正的R平方最大准则,统计量最小准则选出的最优回归子集为年龄因子,收入因子和风格因子。从上述回归结果可以看出,对于0.1的显著性水平,回归模型最终为:y=1114.39133 14.94064x1+0.18212x2+153.51725x72、3 逐步回归结论对于0.1的显著性水平,回归模型最终为:y=1114.39133 14.94064x1+0.18212x2+153.51725x7 把其他所有的变量都选为自变量进行逐步回归分析是,进入的自变量只有三个:年龄,收入,服装风格。方差分析表示线性回归,模型的拟合度显著。 3、主分量分析3.1 主分量分析的基本原理 假定有n个样本,每个样本共有p个变量,构成一个np阶的数据矩阵 当p较大时,在p维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。定义:记x1,x2,x P为原变量指标,z1,z2,z m(mp)为新变量指标系数lij的确定原则: z i与zj(ij;i,j=1,2,m)相互无关;从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2 , p)在诸主成分zi(i=1,2,m)上的荷载 lij( i=1,2,m; j=1,2 ,p)。 从数学上可以证明,它们分别是相关矩阵m个较大的特征值所对应的特征向量。 3.2、主分量分析的计算步骤 一)计算相关系数矩阵rij(i,j=1,2,p)为原变量xi与xj的相关系数, rij=rji,其计算公式为计算特征值与特征向量 解特征方程 , 常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列 ;分别求出对应于特征值的特征向量 , 要求 =1,即 ,其中 表示向量 的第j个分量。计算主成分贡献率及累计贡献率 贡献率 累计贡献率 一般取累计贡献率达85%95%的特征值 所对应的第1、第2、第m(mp)个主成分;计算主成分载荷 3.3 主分量输出结果分析 The PRINCOMP Procedure Observations 84 Variables 8 Simple Statistics x1 x2 x3 x4 x5 x6 x7 x8Mean 303.83333 348.35714 381.21428 335.4285714 332.72619 334.72619 396.000 339.4404762StD 827.54490 841.24459 866.10411 855.9993566 775.51962 868.15436 960.046 836.5176433Correlation Matrixx1 x2 x3 x4 x5 x6 x7 x8x1 1.0000 -.1252 0.0836 -.1437 -.1578 -.1414 0.1057 -.1195x2 - .1252 1.0000 -.1509 0.2532 -.1778 -.1601 -.1709 0.1904 x3 0.0836 -.1509 1.0000 -.1432 0.2510 -.1699 -.1822 -.1790x4 -.1437 0.2532 -.1432 1.0000 -.1394 0.1605 -.1617 -.1593x5 -.1578 -.1778 0.2510 -.1394 1.0000 -.1363 0.1916 -.1742x6 -.1414 -.1601 -.1699 0.1605 -.1363 1.0000 -.1282 0.1764x7 0.1057 -.1709 -.1822 -.1617 0.1916 -.1282 1.0000 -.1424x8 -.1195 0.1904 -.1790 -.1593 -.1742 0.1764 -.1424 1.0000 Eigenvalues of the Correlation Matrix Eigenvalue Difference Proportion Cumulative 1 1.80628124 0.56199544 0.2258 0.2258 2 1.24428580 0.06145140 0.1555 0.3813 3 1.18283440 0.03989194 0.1479 0.5292 4 1.14294246 0.05052812 0.1429 0.6720 5 1.09241434 0.50024502 0.1366 0.8086 6 0.59216933 0.10041951 0.0740 0.8826 7 0.49174981 0.04442719 0.0615 0.9441
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024工厂盘让买卖合同
- 2024商品房买卖合同(预售)
- 2024不动产附负担赠与合同下载
- 编程代码大全(15篇)
- 2024上海市技术开发合同
- 2024标准的赠与合同格式
- 2024学校食堂委托经营的合同
- 2024劳务合同模板国际劳务合同范本
- 2024广东省甘蔗种植订购合同范本
- 2024股票转让合同范本
- 钢结构工程冬季施工方案
- 2024年宏观经济发展情况分析报告
- 摄影入门课程-摄影基础与技巧全面解析
- 251直线与圆的位置关系(第1课时)(导学案)(原卷版)
- XX有限公司人员分流方案
- 大语言模型赋能自动化测试实践、挑战与展望-复旦大学(董震)
- 期中模拟检测(1-3单元)2024-2025学年度第一学期西师大版二年级数学
- 追觅科技在线测评逻辑题
- 2024-2030年中国演艺行业发展分析及发展前景与趋势预测研究报告
- 2024年重庆市渝北区数据谷八中小升初数学试卷
- 凝中国心铸中华魂铸牢中华民族共同体意识-小学民族团结爱国主题班会课件
评论
0/150
提交评论