




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
(优选)统计模型基本方法目前一页\总数六十八页\编于九点目录一、构建步骤1.假设(创新点)2.变量设计(属性、尺度)3.数据收集(问卷、访谈、实验)4.数据分析(变量之间的关系)5.建立模型(模型检验)6.研究评估(信度与效度)二、变量关系分析1.变量之间的关联性检验2.变量之间的变化关系的模型2目前二页\总数六十八页\编于九点研究过程的要点(创新点)研究中最重要的是创新点,所研究问题的假设是研究过程中的关键,所有这一切都必须抓住研究过程中两大环节。(1)问题辨析辨识问题、提炼主题(2)论证和验证主题(即回答解决什么问题,预期取得什么结果,选择论证该预期结果的技术方法)3目前三页\总数六十八页\编于九点1假设(创新点)(1)问题辨析辨识问题、提炼主题(2)论证和验证主题(即回答解决什么问题,预期取得什么结果,选择论证该预期结果的技术方法)4目前四页\总数六十八页\编于九点1假设(创新点)(1)问题辨析辨识问题、提炼主题(2)论证和验证主题(即回答解决什么问题,预期取得什么结果,选择论证该预期结果的技术方法)5目前五页\总数六十八页\编于九点1假设(创新点)(1)问题辨析辨识问题、提炼主题(2)论证和验证主题(即回答解决什么问题,预期取得什么结果,选择论证该预期结果的技术方法)6目前六页\总数六十八页\编于九点找好研究问题(创新)的要点:(1)大量理论阅读,并思考,(2)从实践和理论中观察和归纳。因此,按趣向选择研究领域,集中阅读问题域有关的文献,了解前人的研究成果,同时收集实际问题需要的资料领域细化为研究问题,如领域问题分类、问题定位和变量筛选,确定问题领域的研究视角,切入层面,然后才可能找到研究主题问题导向还是方法导向:有的同学问题还没搞清楚,就说要用某种理论或方法,企图让问题来适应方法。7目前七页\总数六十八页\编于九点问题辨析要素(1)分析单位,个人、群体、组织、项目、社会产品(2)研究侧重点,门类、特性、行为。(3)时间维度,横剖研究、纵贯研究研究单位,对象不一致,例如:缺勤率与单身职工比率政策支持率与青年老年比例8目前八页\总数六十八页\编于九点门类--个人可按性别、年龄、婚姻、高度特性—个人的态度、价值观念、信仰、个性、动机、偏好、倾向、思维方式行为—个人的消费投资行为,企业的产品定价、兼并、招聘,分析单位之间的互动行为如寻租行为、谈判行为、委托代理行为。门类、特性、行为组合构成研究的主要内容。(3)时间维度,横剖研究、纵贯研究趋势研究、同期群研究、追踪研究9目前九页\总数六十八页\编于九点10目前十页\总数六十八页\编于九点2变量之间的关系(1)单变量(统计特征数字)(2)双变量(相关关系,关联分析)(3)多变量(轮廓分析,因子分析,聚类分析,判别分析,对应分析,典型相关分析,路径分析,结构方程模型,多维标度分析,回归分析)11目前十一页\总数六十八页\编于九点1积差相关系数一、概念及适用条件 (一)概念 积差相关,又称积矩相关(或皮尔逊(英国)相关)。公式为(5.1)目前十二页\总数六十八页\编于九点
(二)适用条件
1、两变量均应由测量得到的连续变量。
2、两变量所来自的总体都应是正态分布,或接近正态的单峰对称分布。
3、变量必须是成对的数据。
4、两变量间为线性关系。目前十三页\总数六十八页\编于九点二、计算方法 (一)基本公式计算法 步骤:
目前十四页\总数六十八页\编于九点学生序号X(政治)Y(语文)xyxy17482-1.6-1.72.7227175-4.6-8.740.02380814.4-2.7-11.88485899.45.349.82576820.4-1.7-0.68677891.45.37.42777881.44.36.0286884-7.60.3-2.2897480-1.6-3.75.92107487-1.63.3-5.28
75.683.7
4.4542114.33705
91.8
例1某学校为调查学生学习各科目之间的能力迁移问题,随机抽取10名学生的政治与语文成绩见表5-1,请计算其相关程度。目前十五页\总数六十八页\编于九点
解:依表5-1的资料,计算结果为
即10名学生的政治与语文成绩的相关程度为0.475。目前十六页\总数六十八页\编于九点
(二)原始数据计算法课后练习:用原始数据计算法计算例5-1。目前十七页\总数六十八页\编于九点2其他相关系数一、等级相关系数 (一)斯皮尔曼等级相关
1、概念及适用条件 (1)概念 两变量是等级测量数据,且总体不一定呈正态分布,样本容量也不一定大于30,这样两变量的相关,称为等级相关(斯皮尔曼相关)目前十八页\总数六十八页\编于九点
(2)适用条件
①两变量的资料为等级测量数据,且具有线性关系。 ②连续变量的测量数据,按其大小排成等级,亦可用等级相关计算。 ③不要求总体呈正态分布。
2、计算方法
式中:D为两变量每对数据的等级之差;N表示样本容量。(5.4)目前十九页\总数六十八页\编于九点
计算步骤: (1)计算两变量等级之差D; (2)计算D2; (3)计算∑D2; (4)代入公式(5.4),求得rR
例3求10名学生的语文成绩与阅读能力成绩之间的等级相关系数。目前二十页\总数六十八页\编于九点序号X(语文等级)Y(阅读等级)DD218800267-11354114321152111645-11776118910-11913-241010911∑
12表5-310名学生的语文成绩与阅读能力成绩相关计算表目前二十一页\总数六十八页\编于九点
解:将有关数据代入公式(5.4)得
如果求相关的是连续变量,计算时先把两组数据分别按大小排成等级,最大值取为1等,其它类推。若出现相同的等级分数时,可用它们所占等级位置的平均数作为它们的等级。目前二十二页\总数六十八页\编于九点
例4某校为了研究学生自学能力与学业成绩之间的关系,随机抽取10名学生的自学能力和学科成绩,见表5-4,求其相关系数。序号X(能力)等级Y(成绩)等级DD21903.5884-10.25285780611370108064164857798-115903.5952.51168097010-117857759-2481001981009875806-1110922922.5-10.25∑
25.5表5-410名学生的自学能力和学科成绩相关计算表目前二十三页\总数六十八页\编于九点
解:即学生的自学能力与学习成绩的相关程度为0.85。目前二十四页\总数六十八页\编于九点
(二)肯德尔和谐系数
1、概念及适用条件 (1)概念 当多个变量值以等级顺序表示时,这几个变量之间的一致性程度,称为肯德尔和谐系数或肯德尔W系数。 (2)适用条件 适用于两列以上等级变量。如了解几个评定者对同一组学生成绩等级评定的一致性程度等。目前二十五页\总数六十八页\编于九点 2、计算方法 它以符号W表示,公式为目前二十六页\总数六十八页\编于九点
计算步骤:略 例5某评价小组7人依据已确定的4项内容对某教师打分,将分数转换为等级后的结果见表5-5,求这7人对该教师评价意见的一致性程度。
一二三四
12.542.5123.53.51.51.532.52.514442225341.51.56123472422R18.52213.516∑=70R2342.25484182.25256∑R2=1264.5表5-57人评价某教师意见资料表目前二十七页\总数六十八页\编于九点解:将上述数据代入公式(5.5)中得
实际上,当出现相同等级时,应校正W系数,其校正公式为目前二十八页\总数六十八页\编于九点例5中第一个人评的有2个等级相同,第二个人评的有2个3.5和2个1.5等级…所以∑C为目前二十九页\总数六十八页\编于九点目前三十页\总数六十八页\编于九点二、点二列相关
(一)概念及适用条件
1、概念 两列变量一列是正态连续变量,另一列是二分变量,描述这两个变量之间的相关,称为点二列相关。
2、适用条件 一列是正态连续变量,另一列是二分变量(如男与女,对与错等)。目前三十一页\总数六十八页\编于九点
(二)计算方法 点二列相关系数以表示rpb,公式为
式中:p为二分变量中某一项所占比例;q为二分变量中另一项所占比例,p+q=1;为二分变量中比例为p部分所对应的连续变量的平均数;为二分变量中比例为q部分所对应的连续变量的平均数.σx为连续变量的标准差。目前三十二页\总数六十八页\编于九点
例6随机抽取某区初二数学期末考试卷15份,试计算第二题的得分与总分相一致的程度(即试题的区分度,它是衡量试题鉴别能力的指标值)。数据见表5-6。学生序号123456789101112131415第二题得分101000110111111总分697179868787818981929193929393表5-6数据表目前三十三页\总数六十八页\编于九点
解:(1)求答对第二题的比率p和答错的比率q:
p=10/15=0.67 q=1-p=0.33 (2)求和,分别为答对和答错第二题学生成绩的平均数:
(3)求σx,所有考生的总分的标准差:
σx=7.597(分)
将上述数据代入公式(5.7),可得目前三十四页\总数六十八页\编于九点即该试卷第二题的区分度为0.297。目前三十五页\总数六十八页\编于九点
三、ø相关
(一)概念及适用条件
1、概念 当两变量均为二分变量时,描述这两个变量之间的相关,称为ø相关。
2、适用条件 两变量均为二分变量;或资料整理为2×2列联表一形式。目前三十六页\总数六十八页\编于九点
(二)计算方法
ø相关以符号rø表示,其计算公式为
式中:a、b、c、d分别表示四格表中的实际次数,如表5-7所示。Y1Y2∑X1aba+bX2cdc+d∑a+cb+da+b+c+d表5-72×2列联表目前三十七页\总数六十八页\编于九点
例7某区为研究性别与学习数学的关系,随机抽取100名学生,以数学成绩85分为线进行分类,求性别与数学成绩间的相关系数。85分以上85分以下∑男生311849女生292251∑6040100表5-8100名学生成绩分布表目前三十八页\总数六十八页\编于九点即性别与数学成绩间的相关系数为0.065。目前三十九页\总数六十八页\编于九点第四节解释与应用相关系数时应注意的问题略:见第一节四作业:1、某小组10名学生物理期中与期末考试成绩如下,请用相关散点图分析其成绩动态变化情况并提出指导意见。目前四十页\总数六十八页\编于九点2、某校为研究高中模拟考试与高考之间的相关程度,随机抽取为20名学生模拟考试与高考的数学成绩如下,请计算其相关系数。3、4位教师对5名学生的论文水平按等级评定,结果如下表,求评定结果的一致性程度。目前四十一页\总数六十八页\编于九点目前四十二页\总数六十八页\编于九点线性趋势时间序列的分析平稳性检验长期趋势协整分析移动平均法移动中位数法线性模型法非线性趋势DF与ADF检验因果关系检验Gompertz曲线指数曲线二次曲线修正指数曲线Logistic曲线目前四十三页\总数六十八页\编于九点1.趋势模型的选择方法(1)观察散点图(2)根据观察数据本身,按以下标准选择趋势线一次差大体相同,配合直线二次差大体相同,配合二次曲线对数的一次差大体相同,配合指数曲线一次差的环比值大体相同,配合修正指数曲线对数一次差的环比值大体相同,配合Gompertz曲线倒数一次差的环比值大体相同,配合Logistic曲线(3)比较估计标准误差目前四十四页\总数六十八页\编于九点线性模型法
(概念要点与基本形式)现象的发展按线性趋势变化时,可用线性模型表示线性模型的形式为—时间序列的趋势值
t—时间标号
a—趋势线在Y轴上的截距
b—趋势线的斜率,表示时间t
变动一个单位时观察值的平均变动数量目前四十五页\总数六十八页\编于九点线性模型法
(a和b的最小二乘估计)趋势方程中的两个未知常数
a
和
b
按最小二乘法(Least-squareMethod)求得根据回归分析中的最小二乘法原理使各实际观察值与趋势值的离差平方和为最小最小二乘法既可以配合趋势直线,也可用于配合趋势曲线根据趋势线计算出各个时期的趋势值目前四十六页\总数六十八页\编于九点线性模型法
(a和b的最小二乘估计)1.根据最小二乘法得到求解a和b
的标准方程为取时间序列的中间时期为原点时有t=0,上式可化简为解得:解得:目前四十七页\总数六十八页\编于九点二次曲线
(SecondDegreeCurve)现象的发展趋势为抛物线形态一般形式为a、b、c为未知常数根据最小二乘法求得目前四十八页\总数六十八页\编于九点二次曲线
(SecondDegreeCurve)根据最小二乘法得到求解a、b、c
的标准方程为取时间序列的中间时期为原点时有目前四十九页\总数六十八页\编于九点指数曲线
(Exponentialcurve)用于描述以几何级数递增或递减的现象一般形式为a、b为未知常数若b>1,增长率随着时间t的增加而增加若b<1,增长率随着时间t的增加而降低若a>0,b<1,趋势值逐渐降低到以0为极限目前五十页\总数六十八页\编于九点指数曲线
(a、b的求解方法)采取“线性化”手段将其化为对数直线形式根据最小二乘法,得到求解lga、lgb
的标准方程为
取时间序列的中间时期为原点,上式可化简为目前五十一页\总数六十八页\编于九点修正指数曲线
(Modifiedexponentialcurve)在一般指数曲线的基础上增加一个常数K一般形式为K、a、b为未知常数K>0,a≠0,0<b≠1修正指数曲线用于描述的现象:初期增长迅速,随后增长率逐渐降低,最终则以K为增长极限目前五十二页\总数六十八页\编于九点修正指数曲线
(求解k、a、b
的三和法)趋势值K无法事先确定时采用将时间序列观察值等分为三个部分,每部分有m个时期令趋势值的三个局部总和分别等于原序列观察值的三个局部总和目前五十三页\总数六十八页\编于九点修正指数曲线
(求解k、a、b
的三和法)
根据三和法求得
设观察值的三个局部总和分别为S1,S2,S3目前五十四页\总数六十八页\编于九点龚铂茨曲线
(Gompertzcurve)以英国统计学家和数学家
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖北省圆创教育教研中心2025届高三三月联合测评语文试题及答案
- 初级中学教师教学能力试题及答案
- 班级环境美化与维护计划
- 生产任务调配计划
- 市场定位与产品发展策略计划
- 急诊科心理干预措施研究计划
- 班级家庭作业的优化方案计划
- 高中美术选修课开设策略计划
- 四年级品德与社会下册 第二单元 生产与生活 2 从电视机的变化说起教学设计 新人教版
- 全面掌握陪诊师考试的试题及答案
- 7不甘屈辱 奋勇抗争-圆明园的诉说(教学设计)-部编版道德与法治五年级下册
- GB/T 20424-2025重有色金属精矿产品中有害元素的限量规范
- 2024年黑龙江省水利投资集团招聘笔试真题
- 2025年长沙轨道交通职业学院单招综合素质考试题库完美版
- 2025美国急性冠脉综合征(ACS)患者管理指南解读课件
- 国家开放大学电大《国际私法》形考任务1-5题库及答案
- 统编历史七年级下册(2024版)第7课-隋唐时期的科技与文化【课件】f
- 脑脊液检查11课件
- 医院股东章程范本
- 全国河大版(三起)小学信息技术第二册第3单元第9课《我是小导游-调整幻灯片版式》教学设计
- 2025年江苏省高职单招《职测》高频必练考试题库400题(含答案)
评论
0/150
提交评论