




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本文格式为Word版,下载可任意编辑——数据素养与数学概念相融合的课改研究
材料配比不恰当,就是生熟火候不到等,做到色香味俱全,脑子里要有一套数据在指导.
三、数据来源
我们这个世界的每一个角落都弥漫了数据,来自经济的、政治的、文化的、教导的、科研技术的、军事的等等.不同的行业形成了不同数据平台,有开放的,有不开放的;有滚动的,有储存在数据库里.例如,我们研究一个经济问题,我们可以到政府的金融、统计、财政、税务等部门的数据库或者其网站去搜寻,可以到行业企业的数据库或者网站去获取,以及一些经济方面的社交平台去抓取,也可以设计调查问卷去收集数据等等.
数学上,把数据分为一手数据和二手数据.一手数据是直接调查等方式获得的,也就是原始数据;二手数据是指在研究一个问题时,原始数据之外所用到的数据.因此,提高数据素养,我们要领会怎样去获取数据,一是直接来自数据库,二是去抓取滚动的数据,三是测验与调查,取得第一手数据.其中,在滚动的数据中抓取数据,需要学习相关软件如爬虫等.
调查设计是获取原始数据的重要手段.对于调查对象的全体称之为总体,其中的对象为个体,片面个体组成样本.抽样分为系统抽样、分层抽样、整群抽样、多级抽样等,冷静量为N的总体中产生样本为n的随机样本,常用方法是随机数法.例如,从1到100之間随机抽取20个整数,在R软件中,可以用语句sample(0:100,20)来实现.这些概念都是数据素养提高的载体.
四、数据清洗
清洗数据是为了形成目标数据以及提高数据质量.例如,常见的软件Excel为数据清洗供给了一系列的函数,譬如,删除重复、查找替换以及拼音检查等.DataKlee是数据清洗软件领域的新兵,它是一款全自动的解决方案,支持text、数字和二进制数据.它基于云,无须下载安装,只要有欣赏器和网络即可.创造账户,全体的数据清洗操作都在云上举行;然后会加密、保存到您的私人工作区,通过账户登陆可以随时随地管理工程.学概率论与数理统计课程,需要根本学会这些软件.
五、数据整理
首先对数据举行审核,检验原始数据的完整性、切实性和时效性,按照确定的标准将原始数据举行分组、汇总,把数据列入表格.整理后的数据可以进一步可视化:运用相关软件如SPASS等,把数据变为规律性图形与色调.像条形图、饼图、直方图、盒形图、茎叶图等,这几种图形仅仅代表一个变量的查看数据.对两个变量之间的数据关系,可以用散点图来描述,纵横坐标分别表示两个变量的取值.其他可视化图还有面孔图、地理图形,表示四个变量的星形图等等.
六、数据分析的规律
统计学的根本思维规律是:面对一个问题,提出一个假设,取得样本或者总体的数据,举行数据分析,然后断定或者否决假设.用片面的特性揣测整体的特性,用现在的数据揣测未来的趋势.
七、数据分析
在统计思维的根基上,运用分析工具举行数据分析.统计量是不包含未知总体参数的样本的函数,用于估计的统计量称为估计量.汇总统计量主要包括样本均值、中位数、众数,表示数据中心的位置,均值涉及全体数据,中位数不易受极端数据的影响,具有稳健性.众数表示数据中重复展现次数最多的数据.尺度汇总统计量——样本方差、标准差、级差、标准误差,表示数据的离散程度.样本方差、标准差的区别在于量纲.求方差的分母用n-1,而不用n的理由是这样的样本方差是无偏估计量.标准误差是多个样本均值的标准差.
八、数据挖掘
要举行数据挖掘,还要搞领会变量的常见分布,它表示随机变量的取值和相应概率的关系,随机变量取任意一值所得概率的变化规律称之为分布.熟谙这些分布(模型)是数据挖掘的重要一环,概率分布若知道了,就等于知道了总体.例如,我们知道某一门课程高考的分数按照正态分布,就相当于我们知道了这个总体.
离散型变量分布有:二项分布、多项分布、超几何分布、泊松分布等;连续型变量分布有:正态分布、卡方分布、学生分布、平匀分布、指数分布等.
例如,设有80%的学生能够考试及格,现随机问询7个人,那么至少3个人能够考试及格的概率是多少?
九、数据决策
按照专科生概率论与数理统计课程的教学目标,包括简朴的统计推断、总体参数估计与总体参数的假设检验.估计总体参数的统计量叫作估计量,常用的估计量就是样本的均值x、样本的标准差s、告成比例xn.估计包括点估计与区间估计,要根据现实的处境,采用哪种估计.例如,某产品“合格率是75%,误差±2%,其置信度95%”,这里合格率是一个区间(73%,77%),置信度是指对产生这样一个区间估计过程的一种信仰.当然,我们梦想区间窄,置信度大些好.
以假设检验举行决策根基是利用数据来证伪.假设检验中,一般要设立一个零假设(H0表示)和一个对立假设,称为备择假设(常用H1表示),设立这些假设的意图是指运用样本数据(一般更接近于备择假设),找出零假设和现实之间的冲突,从而否决这个假设,这称之为显著性假设检验.在多数统计测验中的假设检验都是以否决零假设为目标,假设否决不了,那就说明证据缺乏,但零假设未必正确.判定方法如下:
P值是在零假设下,展现检验统计量的现实值.P值越小,说明样本数据不支持零假设,它是由样本数据抉择,而显著性水平是由用户抉择的.
十、数据预料
前面的数据分析,都是基于单一变量,但是世界上一个问题中往往涉及相互关联的多个变量.关切变量和其他有关变量之间的关系,一般称为模型.因此,它们形成函数关系Y=f(X),这里Y称为因变量或者响应变量,X称为自变量或者解释变量、协变量.探索这种关系的过程叫作回归,建立回归模型后可以举行预料.例如,一元线性回归模型如下:
这样,我们取所谓未来的X的一个数值,可以得到预料值Y.
十一、终止语
通过上面的研究,我们把数据素养的十个维度和概率论与数理统计课程中根本概念紧紧地交织在一起,由此,在概率论与数理统计的课堂教学中就融入了数据素养教导,从而摸索举行数学课堂教学模式的提升.课题组相关成员一年多的课堂教学实践说明,能够达成预期目标,教学效果良好.
[1]SchieldM.Informationliteracy,statisticalliteracyanddataliteracy[J].IassistQuarterly,2022(2-3):7-14.
[2]徐群芳.《概率論与数理统计》课程教学的探索与实践[J].大学数学,2022(1):10-13.
[3]王庚.《概率论与数理统计》课程的一种新教改模式[J].南京财经大学学报,2022(2):102-105.
[4]周兴才.应用型本科院校概率论与数理统计教学研究[J].湖北文理学院学报,2022(5):60-63.
[5]朱德全.数学素养构成要素探析[J].中国教导学刊,2022(5):49-51.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论