




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
社会统计学重点章节讲义
——2013年考前辅导社会统计学重点章节讲义
2.1变量的类型定类变量定序变量定距/比变量2.1变量的类型定类变量定序变量定距/比变量2.1变量的类型级别测量等级变量类别统计内容性质低高名称级定类变量频数、交互等定性型(非数值型)—离散型顺序级定序变量比较大小、强弱、差值无意义定量型(数值型)—离散型—连续型间隔级定距变量比较大小、顺序及差值比例级定比变量零点有意义高测量级别的变量可当作低测量级别的变量来分析,反之不可。不同变量适合不同的统计方法(离散型、连续型)。2.1变量的类型级别测量等级变量类别统计内容性质低名称级定2.2样本分布描述样本分布:概括而非具体描述图表:频数表条形图直方图统计量:分布的中心分布的形状
职业频次比例(%)公司职员90345.2公务员1115.6个体户/自营职业者1658.3专职家庭主妇24712.4学生23811.9合计20001002.2样本分布描述样本分布:概括而非具体描述职业频次2.2样本分布原始数据2.2样本分布原始数据2.2样本分布频数表
职业频次比例(%)公司职员90345.2公务员1115.6个体户/自营职业者1658.3专业技术人员(医生/律师等)1185.9专职家庭主妇24712.4学生23811.9其他21810.9合计20001002.2样本分布频数表职业频次比例(%)公司职员9032.2样本分布条形图(离散型变量)2.2样本分布条形图(离散型变量)2.2样本分布折线图(离散型变量)2.2样本分布折线图(离散型变量)2.2样本分布直方图(连续型变量)2.2样本分布直方图(连续型变量)2.2样本分布曲线图(连续型变量)2.2样本分布曲线图(连续型变量)2.2样本分布频数/相对频率全面直观描述概括抽象描述分布的中心分布的形状众数中位数均值极差四分位数差标准差调查中最常用的统计量是均值和标准差均值和标准差分别是样本的一阶矩和二阶矩定距/定比定距/定比定类定序定序定距/定比2.2样本分布频数/相对频率全面直观描述概括抽象描述分布的2.2样本分布计算百分位数(中位数/四分位数)原始数据:观测变量奇数个例:一个n=9的身高样本163,170,176,150,168,171,170,181,179按大小顺序重新排列:150,163,168,170,170,171,176,179,181中位数:第25百分位数为绿色数字的中位数,第75百分位数为蓝色数字的中位数。
观测变量偶数个(去掉一个170)n=8150,163,168,170,171,176,179,181中位数:第25百分位数为绿色数字的中位数,第75百分位数为蓝色数字的中位数。
2.2样本分布计算百分位数(中位数/四分位数)2.2样本分布分组数据:组中值估算精确计算30%20%1511571631692%6%22%32%2.2样本分布分组数据:30%20%1511572.2样本分布计算均值、标准差原始数据分组数据注意分母n为样本数而非分组数自由度信息的个数2.2样本分布计算均值、标准差2.3概率分布概率的定义和性质概率是随着样本量n越来越大时相对频率的(统计意义下的)极限。所有概率之和等于1[0≤P(A)≤1]概率分布/总体分布总体矩:总体均值、总体标准差离散型变量:二项分布连续型变量:正态分布(大样本时离散变量近似适用)2.3概率分布概率的定义和性质2.3概率分布——标准正态分布Pr(Z≥1.64)=0.05Pr(Z≥1.96)=0.0252.3概率分布——标准正态分布Pr(Z≥1.64)=0.0学习重点抽样调查的原理和方法描述性统计推断性统计抽样分布参数估计假设检验群体间的差异性检验变量间的关联性分析学习重点抽样调查的原理和方法3.1抽样分布蒙特卡罗法3.1抽样分布蒙特卡罗法3.1抽样分布——连续型变量样本分布概率/总体分布抽样分布直方图条形图正态分布正态近似定理标准正态分布n越大,波动越小3.1抽样分布——连续型变量样本分布概率/总体分布抽样分布3.1抽样分布——离散型、连续型变量样本比例分布总体比例分布抽样比例分布条形图二项分布正态近似定理标准正态分布n越大,波动越小3.1抽样分布——离散型、连续型变量样本比例分布总体比例分3.1抽样分布示例:总体12345678910抽取2个样本:1.5≤均值≤9.5抽取3个样本:2≤均值≤9抽取4个样本:2.5≤均值≤8.5抽取5个样本:3≤均值≤8正态近似定理:在容量为n的非常简单随机样本中,样本均值以的标准误差(σ为总体标准差)围绕着总体均值μ波动。随着n的增大,的分布也就围绕其目标μ波动得越来越小,它也就越来越接近于正态(铃状)。总体数的大小N对的波动没有影响无论总体是否呈正态分布,样本的均值分布都接近正态随着样本增大,波动越来越小。3.1抽样分布示例:随着样本增大,波动越来越小。3.2参数估计点估计:均值、比例区间估计:置信区间3.2参数估计点估计:均值、比例3.2参数估计——置信区间注意:此处为抽样分布而非样本分布。3.2参数估计——置信区间注意:案例——估计当前市场容量B1在过去的三个月里,您家是否使用了纯水?
1是,使用了
2没有,没有使用B1:过去三个月里使用纯水的家庭比例P,据此估计总体比例π的95%置信区间:案例——估计当前市场容量B1在过去的三个月里,您家是否使用案例——估计当前市场容量B2在过去的三个月里,您家使用了多少桶纯水?B2:月平均用水量,并据此估计总体平均用水量μ的95%置信区间:大样本时,t值与Z值近似,故用此公式。案例——估计当前市场容量B2在过去的三个月里,您家使用了多案例——估计当前市场容量估算总量:纯水家庭用户数量(户)=总户数×家庭用户总体比例家庭月用水总量(桶)=家庭用户总体平均月用水量(桶)×纯水家庭用户数量(户)已知:4个城区总户数:327,314户案例——估计当前市场容量估算总量:案例——估计当前市场容量统计结果:用户规模样本比例总体比例用户总数(户)8.3%6.4%~10.2%20,948~33,386月用水量样本均值总体均值月总用水量(桶)3.262.55~3.9768,291~108,839案例——估计当前市场容量统计结果:用户规模样本比例总体比例用3.3假设检验假设检验是定量研究的基本思想原假设(H0):0假设,无差异,不相关等备选假设(H1):大于、小于、不等于、有差异、有相关性等思想依据小概率事件原理:小概率事件在一次试验中是几乎不可能发生的3.3假设检验假设检验是定量研究的基本思想3.3假设检验假设检验的几种方法置信区间:设定计算置信区间检验参数检验:Z检验、t检验、F检验、卡方检验计算概值检验经典假设检验:设定计算临界域检验第一类错误、第二类错误3.3假设检验假设检验的几种方法3.3假设检验利用置信区间进行假设检验两个总体均值之差的置信区间估算公式:总体方差已知但不相等时:总体方差已知且相等时:3.3假设检验利用置信区间进行假设检验3.3假设检验两个总体比例之差的置信区间估算公式(大样本公式):
3.3假设检验两个总体比例之差的置信区间估算公式(大样本公3.3假设检验概值3.3假设检验概值学习重点抽样调查的原理和方法描述性统计推断性统计群体间的差异性检验差异性检验的基本方法方差分析变量间的关联性分析学习重点抽样调查的原理和方法4.1差异性检验的基本方法单一样本检验:置信区间t检验概值两个独立/配对样本检验:置信区间t检验概值多个样本:方差分析:F检验概值t、F越大,概值越小,H0越不可信。4.1差异性检验的基本方法单一样本检验:4.2方差分析统计量:F比值F的取值情况:如果为真,则F比值将围绕1波动;如果不真,则F比值将倾向于大于1,而且F比值越大,原假设就越不可信。4.2方差分析统计量:F比值4.2方差分析4.2方差分析案例:过去三月平均每户用水量单一样本t检验H0:6桶;H1:9.08桶检验值=6tdf双侧概值平均差异差值的95%置信区间下限上限用了多少桶水2.6650.0123.080.715.44概值小于0.05,可以在95%置信度下拒绝原假设。案例:过去三月平均每户用水量单一样本t检验检验值=6tdf双案例:过去三月平均每户用水量两个独立样本t检验全家平均月收入2000以下者:9.49桶全家平均月收入2000以上者:8.19桶假设:H0:低收入家庭—高收入家庭=0H1:低收入家庭—高收入家庭=1.3检验:置信区间:-3.806~6.403t=0.508;双侧概值=0.613﹥0.05结论:无法在95%置信度下拒绝原假设,低收入家庭与高收入家庭用水量无显著差异案例:过去三月平均每户用水量两个独立样本t检验案例:方差分析变量地区样本量均值标准差95%置信区间最小值最大值下限上限
提前消费水平中国5000.72221.5125570.58930.8551108.879韩国5001.457181.793791.299571.6147908.399日本5001.38961.9984911.2141.5652011.999台湾5002.685841.9900182.510982.86069011.999变差来源变差自由度方差F比值概值组间变差1004.4833334.82899.5060.000组内变差6716.36519963.365
总变差7720.8481999
案例:方差分析变量地区样本量均值标准差95%置信区间最小值最学习重点抽样调查的原理和方法描述性统计推断性统计群体间的差异性检验变量间的关联性分析回归分析相关分析两个定类变量——交互分析两个定距变量——简单积距相关学习重点抽样调查的原理和方法5.1回归分析在回归分析中,斜率b的意义是X有一个单位的变化时Y伴随着发生的变化量。要使的估计更加准确,研究者可以控制的方法主要有:
-减小总体标准差
-增加样本量
-增加样本的标准差Sx,即加大X的变化范围哑变量
当自变量为定类变量时,需要引入哑变量(0-1变量)将数据转化为数量型变量,进一步分析,哑变量的个数为(变量类型-1)5.1回归分析在回归分析中,斜率b的意义是X有一个单位的变5.1回归分析估计总体回归直线总体斜率的估计与检验:置信区间t检验:F检验:5.1回归分析估计总体回归直线5.1回归分析回归模型拟合效果评价:决定系数:r2=0回归的效果等于零或Y的变差中可被回归解释的比例为0;r2=1拟合的回归模型解释了Y中100%的变差。5.1回归分析回归模型拟合效果评价:r2=0回归的效果等于5.2简单积距相关皮尔逊相关系数r=1:两个变量有完全正向的线性联系r=-1:两个变量有完全负向的线性联系r=0:两个变量没有线性联系总体相关系数的检验置信区间(图解法)t检验5.2简单积距相关皮尔逊相关系数案例:过去用水量与今后用水量案例:过去用水量与今后用水量回归与相关相关与回归:维度相关回归X与Y关系平等回归子—响应变量要求X、Y都为随机变量Y为随机变量解释的问题相对较少更广泛回归与相关相关与回归:维度相关回归X与Y关系平等回归子—响应5.3交互分析适用情形:两个定类变量的关联性检验方法:卡方检验卡方检验的局限性以及可能的补救办法5.3交互分析适用情形:案例:使用纯水与家庭收入范围案例:使用纯水与家庭收入范围案例:使用纯水与家庭收入案例:使用纯水与家庭收入总结考试重点:抽样调查的原理和方法描述性统计推断性统计群体间的差异性检验变量间的关联性分析总结考试重点:总结统计思维:样本量越大越好?如何对现象做一个严谨的判断?实证研究基本思想:假设检验社会现象的观察视角:群体间的差异——变量间的关系具体现象(变量)具体分析总结统计思维:谢谢大家!谢谢大家!1、字体安装与设置如果您对PPT模板中的字体风格不满意,可进行批量替换,一次性更改各页面字体。在“开始”选项卡中,点击“替换”按钮右侧箭头,选择“替换字体”。(如下图)在图“替换”下拉列表中选择要更改字体。(如下图)在“替换为”下拉列表中选择替换字体。点击“替换”按钮,完成。532、替换模板中的图片模板中的图片展示页面,您可以根据需要替换这些图片,下面介绍两种替换方法。方法一:更改图片选中模版中的图片(有些图片与其他对象进行了组合,选择时一定要选中图片本身,而不是组合)。单击鼠标右键,选择“更改图片”,选择要替换的图片。(如下图)注意:为防止替换图片发生变形,请使用与原图长宽比例相同的图片。531、字体安装与设置如果您对PPT模板中的字体风格不满意,可进赠送精美图标赠送精美图标社会统计学重点章节讲义
——2013年考前辅导社会统计学重点章节讲义
2.1变量的类型定类变量定序变量定距/比变量2.1变量的类型定类变量定序变量定距/比变量2.1变量的类型级别测量等级变量类别统计内容性质低高名称级定类变量频数、交互等定性型(非数值型)—离散型顺序级定序变量比较大小、强弱、差值无意义定量型(数值型)—离散型—连续型间隔级定距变量比较大小、顺序及差值比例级定比变量零点有意义高测量级别的变量可当作低测量级别的变量来分析,反之不可。不同变量适合不同的统计方法(离散型、连续型)。2.1变量的类型级别测量等级变量类别统计内容性质低名称级定2.2样本分布描述样本分布:概括而非具体描述图表:频数表条形图直方图统计量:分布的中心分布的形状
职业频次比例(%)公司职员90345.2公务员1115.6个体户/自营职业者1658.3专职家庭主妇24712.4学生23811.9合计20001002.2样本分布描述样本分布:概括而非具体描述职业频次2.2样本分布原始数据2.2样本分布原始数据2.2样本分布频数表
职业频次比例(%)公司职员90345.2公务员1115.6个体户/自营职业者1658.3专业技术人员(医生/律师等)1185.9专职家庭主妇24712.4学生23811.9其他21810.9合计20001002.2样本分布频数表职业频次比例(%)公司职员9032.2样本分布条形图(离散型变量)2.2样本分布条形图(离散型变量)2.2样本分布折线图(离散型变量)2.2样本分布折线图(离散型变量)2.2样本分布直方图(连续型变量)2.2样本分布直方图(连续型变量)2.2样本分布曲线图(连续型变量)2.2样本分布曲线图(连续型变量)2.2样本分布频数/相对频率全面直观描述概括抽象描述分布的中心分布的形状众数中位数均值极差四分位数差标准差调查中最常用的统计量是均值和标准差均值和标准差分别是样本的一阶矩和二阶矩定距/定比定距/定比定类定序定序定距/定比2.2样本分布频数/相对频率全面直观描述概括抽象描述分布的2.2样本分布计算百分位数(中位数/四分位数)原始数据:观测变量奇数个例:一个n=9的身高样本163,170,176,150,168,171,170,181,179按大小顺序重新排列:150,163,168,170,170,171,176,179,181中位数:第25百分位数为绿色数字的中位数,第75百分位数为蓝色数字的中位数。
观测变量偶数个(去掉一个170)n=8150,163,168,170,171,176,179,181中位数:第25百分位数为绿色数字的中位数,第75百分位数为蓝色数字的中位数。
2.2样本分布计算百分位数(中位数/四分位数)2.2样本分布分组数据:组中值估算精确计算30%20%1511571631692%6%22%32%2.2样本分布分组数据:30%20%1511572.2样本分布计算均值、标准差原始数据分组数据注意分母n为样本数而非分组数自由度信息的个数2.2样本分布计算均值、标准差2.3概率分布概率的定义和性质概率是随着样本量n越来越大时相对频率的(统计意义下的)极限。所有概率之和等于1[0≤P(A)≤1]概率分布/总体分布总体矩:总体均值、总体标准差离散型变量:二项分布连续型变量:正态分布(大样本时离散变量近似适用)2.3概率分布概率的定义和性质2.3概率分布——标准正态分布Pr(Z≥1.64)=0.05Pr(Z≥1.96)=0.0252.3概率分布——标准正态分布Pr(Z≥1.64)=0.0学习重点抽样调查的原理和方法描述性统计推断性统计抽样分布参数估计假设检验群体间的差异性检验变量间的关联性分析学习重点抽样调查的原理和方法3.1抽样分布蒙特卡罗法3.1抽样分布蒙特卡罗法3.1抽样分布——连续型变量样本分布概率/总体分布抽样分布直方图条形图正态分布正态近似定理标准正态分布n越大,波动越小3.1抽样分布——连续型变量样本分布概率/总体分布抽样分布3.1抽样分布——离散型、连续型变量样本比例分布总体比例分布抽样比例分布条形图二项分布正态近似定理标准正态分布n越大,波动越小3.1抽样分布——离散型、连续型变量样本比例分布总体比例分3.1抽样分布示例:总体12345678910抽取2个样本:1.5≤均值≤9.5抽取3个样本:2≤均值≤9抽取4个样本:2.5≤均值≤8.5抽取5个样本:3≤均值≤8正态近似定理:在容量为n的非常简单随机样本中,样本均值以的标准误差(σ为总体标准差)围绕着总体均值μ波动。随着n的增大,的分布也就围绕其目标μ波动得越来越小,它也就越来越接近于正态(铃状)。总体数的大小N对的波动没有影响无论总体是否呈正态分布,样本的均值分布都接近正态随着样本增大,波动越来越小。3.1抽样分布示例:随着样本增大,波动越来越小。3.2参数估计点估计:均值、比例区间估计:置信区间3.2参数估计点估计:均值、比例3.2参数估计——置信区间注意:此处为抽样分布而非样本分布。3.2参数估计——置信区间注意:案例——估计当前市场容量B1在过去的三个月里,您家是否使用了纯水?
1是,使用了
2没有,没有使用B1:过去三个月里使用纯水的家庭比例P,据此估计总体比例π的95%置信区间:案例——估计当前市场容量B1在过去的三个月里,您家是否使用案例——估计当前市场容量B2在过去的三个月里,您家使用了多少桶纯水?B2:月平均用水量,并据此估计总体平均用水量μ的95%置信区间:大样本时,t值与Z值近似,故用此公式。案例——估计当前市场容量B2在过去的三个月里,您家使用了多案例——估计当前市场容量估算总量:纯水家庭用户数量(户)=总户数×家庭用户总体比例家庭月用水总量(桶)=家庭用户总体平均月用水量(桶)×纯水家庭用户数量(户)已知:4个城区总户数:327,314户案例——估计当前市场容量估算总量:案例——估计当前市场容量统计结果:用户规模样本比例总体比例用户总数(户)8.3%6.4%~10.2%20,948~33,386月用水量样本均值总体均值月总用水量(桶)3.262.55~3.9768,291~108,839案例——估计当前市场容量统计结果:用户规模样本比例总体比例用3.3假设检验假设检验是定量研究的基本思想原假设(H0):0假设,无差异,不相关等备选假设(H1):大于、小于、不等于、有差异、有相关性等思想依据小概率事件原理:小概率事件在一次试验中是几乎不可能发生的3.3假设检验假设检验是定量研究的基本思想3.3假设检验假设检验的几种方法置信区间:设定计算置信区间检验参数检验:Z检验、t检验、F检验、卡方检验计算概值检验经典假设检验:设定计算临界域检验第一类错误、第二类错误3.3假设检验假设检验的几种方法3.3假设检验利用置信区间进行假设检验两个总体均值之差的置信区间估算公式:总体方差已知但不相等时:总体方差已知且相等时:3.3假设检验利用置信区间进行假设检验3.3假设检验两个总体比例之差的置信区间估算公式(大样本公式):
3.3假设检验两个总体比例之差的置信区间估算公式(大样本公3.3假设检验概值3.3假设检验概值学习重点抽样调查的原理和方法描述性统计推断性统计群体间的差异性检验差异性检验的基本方法方差分析变量间的关联性分析学习重点抽样调查的原理和方法4.1差异性检验的基本方法单一样本检验:置信区间t检验概值两个独立/配对样本检验:置信区间t检验概值多个样本:方差分析:F检验概值t、F越大,概值越小,H0越不可信。4.1差异性检验的基本方法单一样本检验:4.2方差分析统计量:F比值F的取值情况:如果为真,则F比值将围绕1波动;如果不真,则F比值将倾向于大于1,而且F比值越大,原假设就越不可信。4.2方差分析统计量:F比值4.2方差分析4.2方差分析案例:过去三月平均每户用水量单一样本t检验H0:6桶;H1:9.08桶检验值=6tdf双侧概值平均差异差值的95%置信区间下限上限用了多少桶水2.6650.0123.080.715.44概值小于0.05,可以在95%置信度下拒绝原假设。案例:过去三月平均每户用水量单一样本t检验检验值=6tdf双案例:过去三月平均每户用水量两个独立样本t检验全家平均月收入2000以下者:9.49桶全家平均月收入2000以上者:8.19桶假设:H0:低收入家庭—高收入家庭=0H1:低收入家庭—高收入家庭=1.3检验:置信区间:-3.806~6.403t=0.508;双侧概值=0.613﹥0.05结论:无法在95%置信度下拒绝原假设,低收入家庭与高收入家庭用水量无显著差异案例:过去三月平均每户用水量两个独立样本t检验案例:方差分析变量地区样本量均值标准差95%置信区间最小值最大值下限上限
提前消费水平中国5000.72221.5125570.58930.8551108.879韩国5001.457181.793791.299571.6147908.399日本5001.38961.9984911.2141.5652011.999台湾5002.685841.9900182.510982.86069011.999变差来源变差自由度方差F比值概值组间变差1004.4833334.82899.5060.000组内变差6716.36519963.365
总变差7720.8481999
案例:方差分析变量地区样本量均值标准差95%置信区间最小值最学习重点抽样调查的原理和方法描述性统计推断性统计群体间的差异性检验变量间的关联性分析回归分析相关分析两个定类变量——交互分析两个定距变量——简单积距相关学习重点抽样调查的原理和方法5.1回归分析在回归分析中,斜率b的意义是X有一个单位的变化时Y伴随着发生的变化量。要使的估计更加
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海科技大学《航海学》2023-2024学年第二学期期末试卷
- 钦州幼儿师范高等专科学校《酒店服务营销》2023-2024学年第二学期期末试卷
- 黄淮学院《地理学基本问题》2023-2024学年第二学期期末试卷
- 福建卫生职业技术学院《小学文学与媒体教育》2023-2024学年第二学期期末试卷
- 集宁师范学院《跨境电子商务实务》2023-2024学年第二学期期末试卷
- 浙江工业大学之江学院《管理心理学D1》2023-2024学年第二学期期末试卷
- 黑龙江建筑职业技术学院《日语会话3》2023-2024学年第二学期期末试卷
- 崇左幼儿师范高等专科学校《比较思想教育学》2023-2024学年第二学期期末试卷
- 武汉商贸职业学院《制药工程与工艺》2023-2024学年第二学期期末试卷
- 云南工贸职业技术学院《学校心理辅导》2023-2024学年第二学期期末试卷
- 北京市丰台区2024-2025学年高二上学期期末英语试题
- 电力安全一把手讲安全课
- 小学三年级数学口算天天练-A4纸直接打印
- 2025年亿达商学院成立仪式及论坛经验总结(三篇)
- (2025)驾照C1证考试科目一必考题库及参考答案(包过版)
- 2025年湖南理工职业技术学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 罕见病诊治与病例管理制度
- 课题申报书:“四新”建设与创新创业人才培养基本范式研究
- 妇科常见急危重症护理
- 春季高考高职单招数学模拟试题七套含答案
- 2024-2025学年陕西省宝鸡市高三上学期高考模拟检测(一)英语试题(含解析)
评论
0/150
提交评论