




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 AB专业三门公共数学课期末成绩数据分析摘要针对问题一,我们首先对数据进行了处理,剔除异常值。我们统计了A、B专业每个同学的高等数学、线性代数、概率论与数理统计的成绩,按照专业和科目划分为六个子样本。首先对各个子样本做KS正态性检验,以判断样本总体的正态性。使用SPSS软件对A专业的高等数学和B专业的高等数学,A专业线性代数和B专业的线性代数,A专业的概率论与数理统计和B专业的概率论和数理统计分别做两个平均值的t检验。最终我们得出A、B两专业在三个科目上没有显著性差异的结论。针对问题二,我们需要探究的是两个专业的学生的数学水平有无明显差异。我们首先将每个同学的高等数学,线性代数,概率论与数理统
2、计成绩按照一定权重计算出三科成绩的平均值,该平均值代表了每个同学的数学成绩。按照A、B专业划分为两个子样本。我们使SPSS软件对各子样本做KS正态性检验,得出样本总体正态性良好的结论。然后对两个样本采用做两个平均值的t检验,得出P值,大于显著性水平0.05,拒绝原假设,即认为两组数据之间没有显著性差异。我们得出A、B两专业数学水平没有差异的结论针对问题三,需要分析高等数学对线性代数和概率论与数理统计的影响。我们我们统计了A、B专业每个同学的高数、线性代数、概率论与数理统计的成绩,分别看做样本一、二、三。当给出一个同学的高数成绩就对应了该同学的线性代数成绩,也就是说,该同学的高数成绩、线性代数成
3、绩,就构成了两个变量。我们借助SPSS软件对两个样本之间数据做了双变量相关检验。我们确定了高等数学成绩成绩和线性代数成绩具有很强的相关性。进一步使用EXCEL画出散点图,对高等数学与线性代数之间的关系有初步的认识。然后我们使用线性回归的方法确定高等数学成绩和线性代数成绩的回归模型。接下来我们使用相关系数来检验模型的显著性。使用同样的方法我们确定了高等数学成绩和概率论与数理统计的回归模型。最终我们得出结论,高等数学成绩的优劣会影响线性代数、概率论与数理统计的成绩。针对问题四,是紧扣上面三问的结果,对三门课程的分析,和对不同专业相同课程的不同成绩的分析,从学生学习的角度提出我们自己的看法。关键词:
4、KS正态性检验 t检验 显著性差异 双变量相关检验 线性回归 相关系数一、问题重述附件一是某高校A专业和B专业的高等数学上册、高等数学下册、线性代数、概率论与数理统计三门公共数学课程的期末考试成绩数据,请根据数据分析并解决以下几个问题:(1)针对每门课程分析,两个专业学生的分数是否有明显差异?(2)针对专业分析,两个专业学生的数学水平有无明显差异?(3)通过数据分析说明:高等数学成绩的优劣,是否影响线性代数、概率论与数理统计的得分情况?(4)根据你所作出的以上分析,面向全校本科生同学,撰写一篇1000字左右的论文,阐述你对于大学数学课程学习方面的看法。二、问题分析问题一要求针对每门课程分析,两
5、个专业学生的分数是否有明显差异。我们首先对数据进行了处理,剔除异常值。我们统计了A、B专业每个同学的高数、线性代数、概率论与数理统计的成绩,按照专业和科目划分为六个子样本。首先对各个子样本做KS正态性检验,以判断样本总体的正态性。使用SPSS软件对A专业的高等数学和B专业的高等数学,A专业线性代数和B专业的线性代数,A专业的概率论与数理统计和B专业的概率论和数理统计分别做两个平均值的t检验。进而确定A、B两专业在三个科目上有无显著性差异。问题二要求的是分析两个专业学生的数学水平有无明显差异,而供我们研究使用的数据是A、B两专业高等数学、线性代数及概率论与数理统计的成绩,于是我们将此类归结为显著
6、性差异检验的问题。我们首先将每个同学的高等数学,线性代数成绩,概率论与数理统计按照一定权重计算出三科成绩的平均值,该平均值代表了每个同学的数学成绩。按照A、B专业划分为两个子样本。我们使SPSS软件对各子样本做KS正态性检验。在验证样本整体正态性后,进而对对两个样本采用做两个平均值的t检验,以确定两组数据之间是否有显著性差异。最终得出确定两个专业学生的数学水平有无明显差异。问题三要求是需要分析高等数学对线性代数和概率论与数理统计的影响。我们我们统计了A、B专业每个同学的高数、线性代数、概率论与数理统计的成绩,分别看做样本一、二、三。当给出一个同学的高数成绩就对应了该同学的线性代数成绩,也就是说
7、,该同学的高数成绩、线性代数成绩,就构成了两个变量。我们借助SPSS软件对两个样本之间数据做了双变量相关检验。然后我们确定高等数学成绩和线性代数成绩的回归模型,我们使用相关系数来检验模型的显著性。使用同样的方法我们确定了高等数学成绩和概率论与数理统计的回归模型。问题四是对上面三问的总结,我们需要根据上述的建模结果提出我们的看法。三、模型假设与符号说明3.1 模型假设(1)假设0分当缺考处理,有0分的那组数据没有处理意义。(2)假设样本准确,处理做出的分析是接近实际,能够反映实际状况的。(3)学生和学生之间,班级和班级之间的成绩是相互独立的,没有影响的。(4)假设样本学生的成绩均来自于实际,成绩
8、能真实的反应学生的数学水平由此做出的分析是接近实际。3.2 符号说明符号说明样本中第个同学的成绩样本中的同学的个数样本的方差样本的平均值样本的自由度在置信度下的标准值R相关系数P结果可信程度的一个递减指标四、模型建立与求解4.1问题一的模型建立与求解4.1.1 两个平均值的t检验简介统计学指出:对于两个平均值的比较,设有两组试验数据:与,其中分别是两组数据的个数,这两组数据都服从正态分布,根据两组数据的方差是否存在显著差异,分为以下两种情况进行分析。 如果两组数据的方差无显著差异时,则统计量服从自由度的t分布。式中s为合并标准差,其计算式为: 如果两组数据的精密度或方差有显著差异时,则统计量服
9、从自由度为服从自由度的t分布。其中根据给定的显著性水平,将所计算的t值与临界值比较,做出检验结论。双侧检验时,若,则可判断两平均值无显著差异,否则就有显著差异。单侧检验时,若,且,则可判断平均值1较平均值2无显著减小,否则有显著减小,此为左侧检验;若,且,则可判断平均值1较平均值2无显著增大,否则有显著增大,此为右侧检验。4.1.2 F检验法简介F检验(F-test)适用于两组具有正态分布的实验数据之间的精密度的比较。设有两组试验数据:和,两组数据都服从正态分布,样本方差分别为和,则服从第一自由度为,第二自由度为的F分布(F-distributon)对于给定的显著性水平,将所计算的F值与临界值
10、比较,即可作出检验结论。双侧检验时,若,则可判断方差1与方差2无显著差异,否则有显著差异。单侧检验时,若,且,则判断方差1比方差2无显著减小,否则有显著减小,此为左侧检验;若,且,则判断方差1比方差2无显著增大,否则有显著增大,此为右侧检验。4.1.3 样本的确定剔除异常值:t检验法要求样本总体满足正态分布,我们需要验证各个子样本的正态性,从而判断样本整体的正态性。首先我们需要剔除异常值,我们将含有0分的学生所有科目的成绩予以剔除,另外A专业的一位线性代数取得100分的同学的成绩使得A专业的线性代数成绩不满足正态分布,所以也将其所有成绩剔除。另外原数据中有一处成绩记为725,明显的是输入错误,
11、我们将其修改为72.5,不做剔除处理。在剔除异常值的基础上,我们首先将每个同学个高等数学1成绩和高等数学2成绩求平均值,记作该同学的高等数学成绩。按照A、B专业划分为两个样本,分别别记作样本一和样本二,样本一、二构成了t检验的两组数据。同理将A专业每个同学的线性代数成绩数据记作样本三,将B专业每个同学的线性代数成绩数据记作样本四,同样样本三和样本四构成了t检验的两组数据。同理将A专业每个同学的概率论和数理统计成绩数据记作样本五,将B专业每个同学的概率论和数理统计数据记作样本六,同样样本五和样本六构成了t检验的两组数据。4.1.4 样本总体的K-S正态性检验样本总体的正态性检验方法如下:以每个同
12、学的高等数学,线性代数和概率论与数理统计的成绩为变量分析,利用SPSS 软件绘制A、B专业的高等数学,线性代数和概率论与数理统计的直方图和趋势图依次如下图所示:我们假设这六组数据都服从正态分布,利用SPSS 软件进行K-S 正态性检验的具体结果见附表4.1-1。组数据的近似相伴概率值P 分别为0.142,0.051,0.200,0.711,0.089和0.286均大于一般的显著水平0.05,则接受原来假设,即A、B专业高等数学,线性代数和概率论与数理统计的成绩数据符合近似正态分布。4.1.5 A、B专业高等数学,线性代数和概率论与数理统计的平均成绩的t检验使用SPSS软件对A专业的高等数学和B
13、专业的高等数学,A专业线性代数和B专业的线性代数,A专业的概率论与数理统计和B专业的概率论和数理统计分别做两个平均值的t检验,分析结果如图所示;统计学指出如果显著性概率P<显著性水平(),则拒绝零假设,即认为两组样本的均值存在显著性差异;若P>显著性水平(),则不拒绝零假设,即认为两组样本的均值不存在显著性差异。 根据SPSS得出的数据可知三组数据比较得出的P值分别为0.507,0.787,0.192,均大于显著性水平(),则不拒绝零假设,即认为这三组样本的均值不存在显著性差异。即我们认为A专业的高等数学成绩和B专业的高等数学之间没有显著性差异,A专业的线性代数成绩和B专业的线性代
14、数成绩没有显著性差异,C专业的概率论与数理统计和B专业的概率论与数理统计成绩没有显著性差异。4.2问题二的模型建立与求解4.2.1 样本的确定在剔除异常值的基础上,我们首先将每个同学的高等数学1成绩和高等数学2成绩求平均值,记作该同学的高等数学成绩。对A、B专业每个同学高等数学、线性代数、概率论与数理统计成绩按照11:2.5:2.5的权重计算其加权平均值,该平均值代表了每个同学的数学水平,我们称其为每个同学的数学平均成绩。按照A、B专业分为两个样本,记作样本一和样本二。4.2.2 样本总体的K-S正态性检验t检验法要求样本总体满足正态性分布,我们验证各个子样本的正态性,从而判断样本整体的正态性
15、,样本总体的正态性检验方法如下:以每个同学的数学平均成绩为变量分析,利用SPSS 软件绘制A、B专业数学成绩的直方图和趋势图如下图所示:我们假设两组数据都服从正态分布,利用SPSS 软件进行K-S 正态性检验的具体结果见附表4.2-1。组数据的近似相伴概率值P 分别为0.184和0.487,大于我们一般的显著水平0.05,则接受原来假设,即A、B专业数学平均成绩数据符合近似正态分布。4.2.3 A、B专业数学平均成绩的t检验使用SPSS软件对A、B两专业数学平均成绩做两个平均值的t检验,分析结果如图所示:统计学指出如果显著性概率P<显著性水平(),则拒绝零假设,即认为两组样本的均值存在显
16、著性差异;若P>显著性水平(),则不拒绝零假设,即认为两组样本的均值不存在显著性差异。在本题中,P=0.725,大于显著性水平,所以我们认为两组样本数据之间不存在显著性差异,即我们认为A、B两专业的数学水平没有差异。4.3问题三的模型建立与求解4.3.1双变量相关检验的简介统计学指出:双变量分析目标是确定两个变量之间的相关性,测量它们之间的预测或解释的能力。在本题中,我们想通过对高等数学、线性代数、概率论与数理统计成绩的分析确定高数成绩是否对其他两门课目成绩存在某种影响,进一步探究课程之间的相互影响关系。双变量统计分析技术包括:相关分析和回归分析。相关分析(correlation ana
17、lysis),相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。4.3.2 高数成绩和线性代数的关系Step1:样本的双变量相关检验我们统计了A、B专业每个同学的高数、线性代数、概率论与数理统计的成绩,分别看做样本一、二、三。当给出一个同学的高数成绩就对应了该同学的线性代数成绩,也就是说,该同学的高数成绩、线性代数成绩,就构成了两个变量。我们借助SPSS软件对两个样本之间数据做了双变量相关检验
18、,检验结果如图所示:由此我们可以得出结论,在0.01的显著水平下,同一个同学的高数成绩和它的线性代数成绩具有明显的相关性。Step2:使用EXCEL软件绘制散点图在确定了数学成绩和线性代数成绩具有明显的相关性后,我们进一步探讨同一个同学的高数成绩和线性代数成绩的数学关系。首先我们以同学的高数成绩为自变量,以该同学的线性代数成绩为因变量,绘制出二者的散点图,结果如图所示:初步我们可以得出结论,高数成绩和线性代数成绩呈正相关关系,在误差允许的范围内,当一个同学的高数成绩越高时,它的线性代数成绩一般也较高。Step3:线性回归分析由步骤2的散点图我们初步可以确定高数成绩和线性代数成绩呈线性相关系,于
19、是我们使用EXCEL软件,计算出高数成绩和线性代数成绩的函数表达式为y =0.5964x+29.889(其中x代表高等数学成绩,y代表线性代数成绩)。Step4:线性回归方程显著性的检验在置信度0.05,自由度252下,我们查询相关系数表得出,于是我们得出线性回归方程是可信的结论。4.3.3 高数成绩和概率论与数理统计成绩的关系Step1:样本的双变量相关检验我们统计了A、B专业每个同学的高数、线性代数、概率论与数理统计的成绩,分别看做样本一、二、三。当给出一个同学的高数成绩就对应了该同学的概率论和数理统计成绩,也就是说,该同学的高数成绩、概率论与数理统计就构成了两个变量。我们借助SPSS软件
20、对两个样本之间数据做了双变量相关检验,检验结果如图所示:由此我们可以得出结论,在0.01的显著水平下,同一个同学的高数成绩和它的线性代数成绩具有明显的相关性。Step2:使用EXCEL软件绘制散点图在确定了数学成绩和概率论与数理统计成绩具有明显的相关性后,我们进一步探讨同一个同学的高数成绩和概率论和数理统计的数学关系。首先我们以同学的高数成绩为自变量,以该同学的概率论和数理统计成绩为因变量,绘制出二者的散点图,结果如图所示:初步我们可以得出结论,高数成绩和概率论与数理统计成绩呈正相关关系,在误差允许的范围内,当一个同学的高数成绩越高时,它的概率论与数理统计成绩一般也较高。Step3:线性回归分
21、析由步骤2的散点图我们初步可以确定高数成绩和概率论和数理统计成绩呈线性相关系,于是我们使用EXCEL软件,计算出高数成绩和线性代数成绩的函数表达式 y=0.7084x+24.702(其中x表示高等数学成绩,y表示概率论和数理统计成绩)。Step4:线性回归方程显著性的检验在置信度0.05,自由度252下,我们查询相关系数表得出,于是我们得出线性回归方程是可信的结论。4.4问题四的求解我们发现就针对高等数学,线性代数,概率论与数理统计这些课程的成绩进行分析,我们发现这两个专业学生的分数没有明显差异。通过比较我们发现这两个专业的这三门课程的成绩是没有显著性差异的,所以可以说关于这个三门课程,这两个
22、专业是差不多的,就是说个人的学习情况也可以以另外这个专业的情况为基础进行比较,也能够得到比较合理的对比结果。因此我们可以明确知道自己如果置身于另外的专业中自己所学的这三门课成绩所处于的层次水平。我们通过第二问的研究发现就针对专业进行分析,两个专业学生的数学水平没有明显差异。所以我们认为就专业而言并没有因为专业的不同而导致数学水平上的差异。所以从学生角度而言,因为数学水平是专业课程学习的基础,尤其是对理工科学生而言。另外我们根据比较常用的计算数学水平方法根据学分进行加权平均数计算从而得到数学水平的一个分数值,所以学生们在学习过程中应该抓住主要矛盾,也就是高等数学上下两册。努力在学分高的科目上多一点努力,这样可以使评价个人数学水平的分数值的提高效益最大化,当然也不能在任何一门上懈怠,因为这个评价个人数学水平的分数值仍是考虑所有科目的成绩。根据以上的建模内容,我们从而知道:高等数学成绩的优劣影响着线性代数、概率论与数理统计的得分情况。所以我们认为大学本科学生需要努力学好高等数学。就我们大多数学生而言,高等数学上册是在大学一年级上学期学的,大学第二学期学生们应该是学习高等数学下册和线性代数,接着的一个下学期会学习概率论与数理统计。由此
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB32/T 4360-2022未成年人保护社会组织服务规范
- DB32/T 4313-2022滨海盐碱地生态化整治技术规程
- DB32/T 4268-2022社区居家医养结合服务规范
- DB32/T 4091-2021专业纤维检验机构管理规范
- DB32/T 4059-2021基于精准农业的作物生长环境信息采集规范
- DB32/T 4049-2021雷电防护装置检测部位及检测点确认技术规范
- DB32/T 3958-2020化工企业安全生产信息化管理平台建设技术规范
- DB32/T 3843-2020“江苏精品”评价通则
- DB32/T 3761.16-2020新型冠状病毒肺炎疫情防控技术规范第16部分:考场
- DB32/T 3492-2018稀土冶炼废渣放射性豁免要求
- 500MW光伏电站项目500kV升压站输电线路工程主要建设内容
- 云南省食品安全管理制度
- 17珍惜当下的美好《心理健康》
- 2024年越南辣椒行业现状及前景分析2024-2030
- 大学生器乐训练基础智慧树知到期末考试答案章节答案2024年丽水学院
- 沟通的艺术智慧树知到期末考试答案章节答案2024年湖南师范大学
- 幼儿园儿童游戏论
- 2024年江苏省扬州市中考英语试卷真题(含答案)
- 上海市2023-2024学年下学期八年级物理期末练习
- 2024年乡村医生资格考试题库附答案(共150题)
- 六年级下册的第五单元作文6篇
评论
0/150
提交评论