版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
课题第13课数据的表格分析与正态分析课时2课时(90min)教学目标知识技能目标:(1)掌握数据交叉表和透视表分析的方法(2)掌握数据正态性分析的方法(3)能对数据进行交叉表与透视表、正态性等分析素质目标:强化数据安全意识,提高信息技术应用能力教学重难点教学重点:数据交叉表和透视表分析的方法教学难点:对数据进行交叉表与透视表、正态性等分析教学方法案例分析法、问答法、讨论法、讲授法教学用具电脑、投影仪、多媒体课件、教材、文旌课堂APP教学设计第1节课:→→传授新知(28min)→课堂实践(10min)第2节课:→传授新知(20min)→课堂讨论(12min)→课堂小结(3min)→作业布置(2min)教学过程主要教学内容及步骤设计意图第一节课考勤
(2min)【教师】使用文旌课堂APP进行签到【学生】按照老师要求签到培养学生的组织纪律性,掌握学生的出勤情况问题导入(5min)【教师】提出问题我们已经学习了数据的统计分析,那么数据表格如何分析呢?【学生】思考、举手回答通过提问的方法,了解学生对上节课知识的掌握程度,进而引出新知传授新知
(28min)【教师】总结学生的回答,并引入新知,讲解数据表格分析的相关知识✈【教师】请同学们扫描二维码学习数据表格分析,并回答以下问题:表格分析包含哪些常用方法?✈【学生】扫描二维码、思考、回答问题✈【教师】总结学生的回答,并讲解新知数据的交叉表和透视表是数据分析中常用的方法。通过交叉表和透视表可以分析数据的不同变量之间存在的关系。4.3.1数据交叉表分析✈【教师】提出问题什么是数据交叉表?✈【学生】聆听、思考、主动回答问题✈【教师】总结学生的回答,并讲解新知交叉表是一种常用的分类汇总表格,可以统计变量交叉出现的频数,帮助分析变量之间的相互关系。最简单也最常用的是2×2交叉表,即两个变量的交叉表,如性别与商品类型的关系、年龄与商品类型的关系等。✈【教师】多媒体出示了crosstab()函数的一般格式(详见教材),并详细讲解各部分表示的内容Pandas提供了crosstab()函数用于制作数据交叉表,其一般格式如下。pandas.crosstab(index,columns,margins=False,margins_name='All',normalize=False)其中,index表示交叉表行字段的列;columns表示交叉表列字段的列;margins表示是否汇总交叉表的行和列,如果为True表示汇总,如果为False表示不汇总,默认为False;margins_name表示汇总行和列的标签,默认为“All”;normalize表示是否对统计的频数标准化,即统计频率,取True或“all”表示以总样本数统计频率,取“index”表示以行的样本总数统计频率,且只显示列的汇总,取“columns”表示以列的样本总数统计频率,且只显示行的汇总,取False表示不标准化,默认为False。✈【教师】按照教材步骤进行问题分析并进行演示例4-7(详见教材)的程序编写步骤:首先导入“产品订单信息表.xlsx”文件中的数据;然后统计并汇总性别和产品类型的交叉频数;最后统计并汇总性别和产品类型的交叉频率。importpandasaspdpd.set_option('display.unicode.east_asian_width',True)df=pd.read_excel('产品订单信息表.xlsx')df1=pd.crosstab(index=df['性别'],columns=df['产品类型'])print('统计性别和商品类型交叉频数的数据df1:\n',df1)df2=pd.crosstab(index=df['性别'],columns=df['产品类型'],margins=True)print('统计和汇总性别和商品类型交叉频数的数据df2:\n',df2)df3=pd.crosstab(index=df['性别'],columns=df['产品类型'],margins=True,normalize=True)print('统计和汇总性别和商品类型交叉频率的数据df3:\n',df3)df4=pd.crosstab(index=df['性别'],columns=df['产品类型'],margins=True,margins_name='总数',normalize='index')print('按行统计和汇总性别和商品类型交叉频数的数据df4:\n',df4)(详见教材)✈【学生】观察、记录、理解✈【学生】教师演示完成后,学生按照教材提示和教师演示进行实际操作,并对比程序运行结果(详见教材)✈【教师】巡视课堂记录,对学生进行个别指导✈【教师】提出学习任务:对比程序结果,进行程序分析和结果分析。✈【学生】观察、记录、理解、分析✈【教师】总结学生的分析结果df3统计和汇总性别和产品类型的交叉频率,与df2对比会发现,df3计算的是基于样本总数的频率,如第1行第1列的数据0.4=6/15;df4按行统计并汇总性别和产品类型的交叉频率,与df2对比会发现,df4计算的是基于所在行样本总数的频率,如第1行第1列的数据0.666667=6/9。结果分析:购买手机的客户中,女性客户多于男性客户;购买电脑的客户中,男性客户和女性客户一样多。4.3.2数据透视表分析✈【教师】提出问题什么是数据透视表?✈【学生】聆听、思考、主动回答问题✈【教师】总结学生的回答,并讲解新知透视表是一种交互式的表,它可以统计行字段和列字段与第3个字段的关系,如不同性别的人在不同商品上的消费程度。✈【教师】多媒体出示了pivot_table()函数的一般格式(详见教材),并详细讲解各部分表示的内容Pandas提供了pivot_table()函数用于制作数据透视表,其一般格式如下。pandas.pivot_table(data,values=None,index=None,columns=None,aggfunc='mean',margins=False,margins_name='All')其中,data表示需要分析的数据;values、index和columns表示data的列标签,分别作为透视表的统计字段、行字段和列字段;aggfunc表示统计指标,可以取“sum”(求和)、“mean”(求均值)、“max”(求最大值)等,默认为“mean”。【学生】聆听、思考、理解、记忆通过教师讲解、课堂讨论、多媒体演示等方式,使学生了解数据表格分析的相关内容课堂实践
(10min)【教师】布置实践任务基于原始数据的产品订单信息,使用透视表分析其中性别、产品类型和总消费及平均消费的关系。【学生】聆听、思考、讨论、实践练习【教师】总结学生实践过程中遇到的问题,进行问题分析及程序说明问题分析:将性别与商品类型分别作为透视表的行字段和列字段,消费金额作为统计字段,并分别使用“sum”和“mean”作为统计指标。参考代码:importpandasaspdpd.set_option('display.unicode.east_asian_width',True)df=pd.read_excel('产品订单信息表.xlsx')df1=pd.pivot_table(df,values='消费金额',index='性别',columns='产品类型',aggfunc='sum',margins=True,margins_name='总消费')print('统计和汇总性别、产品类型及总消费的数据df1:\n',df1)df2=pd.pivot_table(df,values='消费金额',index='性别',columns='产品类型')print('统计和汇总性别、产品类型及平均消费的数据df2:\n',df2)。通过课堂实践,加深学生对数据交叉表分析的理解第二节课问题导入(8min)【教师】提出问题我们已经学习了数据排序的相关知识,那么数据的正态性如何进行分析呢?【学生】聆听、思考、回答问题通过提问的方法,引导学生主动思考,激发学生的学习兴趣传授新知(20min)【教师】总结学生的回答,并引入新知,讲解数据正态性分析的相关知识4.4.1数据的正态分布✈【教师】请同学们回答以下问题:什么是正态分布?✈【学生】聆听、思考、回答问题✈【教师】总结学生的回答,并讲解新知正态分布正态分布是指随机变量服从一个位置参数(即均值µ)和尺度参数(即标准差σ)的概率分布。正态分布在几何上的表现就是正态曲线,理论上是一条中间高、两端逐渐下降的完全对称的钟形曲线。✈【教师】多媒体出示正态分布曲线图(详见教材),并详细讲解均值及中心位置等内容从图中可以看出,符合正态分布的随机变量在µ−σ~µ+σ取值的概率为68.2%,在µ−2σ~µ+2σ取值的概率为95.4%,在µ−3σ~µ+3σ取值的概率为99.7%。当µ为0,σ为1时为标准正态分布。正态分布的均值决定了曲线的中心位置,当均值为0时,中心位置在x轴为0的位置;当均值大于0且绝对值越大时,曲线整体右偏且离y轴越远;当均值小于0且绝对值越大时,曲线整体左偏且离y轴越远。正态分布的标准差决定了曲线的形状,标准差越大,数据分布越分散,曲线越“矮胖”;标准差越小,数据分布越集中,曲线越“高瘦”。4.4.2正态性分析数据的正态性分析可以通过偏度和峰度,以及直方图实现。1.偏度和峰度✈【教师】多媒体出示不同偏度的分布曲线图(详见教材),并详细讲解偏度大小对曲线的影响数据的偏度和峰度是描述数据分布与正态分布偏离程度的两个常用统计指标。(1)偏度用于描述数据分布的对称性,正态分布的偏度为0。当偏度大于0时,称为正偏态,分布曲线出现右侧长尾;当偏度小于0时,称为负偏态,分布曲线出现左侧长尾。不同偏度的分布曲线如图所示。✈【教师】多媒体出示skew()函数格式(详见教材),并详细讲解各部分的内容Pandas提供了skew()函数用于计算数据的偏度,其一般格式如下。DataFrame.skew()✈【教师】多媒体出示不同峰度的分布曲线图(详见教材),并详细讲解峰度大小对曲线的影响(2)峰度用于描述数据分布形态的陡缓程度。在实际应用中,正态分布的峰度为0(正态分布的峰度常数为3,通常做减3处理),当峰度大于0时,为尖顶峰,分布曲线较陡峭;当峰度小于0时,为平顶峰,分布曲线较平坦。不同峰度的分布曲线如图所示。✈【教师】多媒体出示kurt()函数格式(详见教材),并详细讲解各部分的内容Pandas提供了kurt()函数用于计算数据的峰度,其一般格式如下。DataFrame.kurt()✈【教师】按照教材步骤逐步分析并进行演示例4-9(详见教材)的程序编写步骤:首先通过随机生成两个1~6的整数模拟抛掷骰子(10000次);然后统计两个骰子抛掷数字的和,并按行标签升序排序;最后计算其偏度和峰度。importnumpyasnpimportpandasaspddata1=np.random.randint(1,7,10000)data2=np.random.randint(1,7,10000)arr=data1+data2df=pd.DataFrame(data1+data2)count=df.value_counts().sort_index()print('两个骰子抛掷数字和的统计结果:\n',count)print('偏度:',df.skew().iloc[0])print('峰度:',df.kurt().iloc[0])(详见教材)✈【学生】观察、记录、理解✈【学生】教师演示完成后,学生按照教材提示和教师演示进行实际操作,并对比程序运行结果(详见教材)✈【教师】巡视课堂记录,对学生进行个别指导✈【教师】提出学习任务:对比程序结果,进行结果分析。✈【学生】观察、记录、理解、分析✈【教师】总结学生的分析结果偏度接近0,说明没有正偏或负偏的趋势,从统计频数也可以大致看出分布是比较对称的,分别向左右两侧逐渐均匀下降;峰度小于0,说明中间的数据并不是非常集中,而是比较分散,是平顶曲线,从统计频数也可以看出和为7的中间位置频数最高,且两边的频数慢慢减少。2.直方图✈【教师】请同学们回答以下问题:什么是直方图?✈【学生】聆听、思考、回答问题✈【教师】总结学生的回答,并讲解新知正态分布直方图是一种统计报告图,由一系列高度不等的矩形柱表示数据的分布情况,通常用于分析数据是否符合正态分布,例4-9中两个骰子抛掷的数字之和的直方图如图所示。从图中可以看出,该数据符合正态分布,且分布曲线较为平坦,与例4-9计算的偏度和峰度的结果一致。✈【提示】直方图的具体内容可参见第5章【学生】聆听、思考、理解、记录通过教师讲解和课堂讨论,使学生了解数据统计分析的相关知识,包括数值型数据统计分析和字符型数据统计分析课堂实践(12min)【教师】提出问题,请同学们分小组实践:统计班级最近一次考试成绩,计算其偏度和峰度。聆听、结组、思考、讨论、写代码、展示程序代码及运行结果【教师】聆听学生的讨论结果,并查看程序运行结果通过课堂实践,使学生能够了解更多关于数据正态性分析的知识课堂小结
(3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年统计工作计划与安排
- 护士个人年度工作计划汇编
- 加油站安全工作隐患排查计划
- 2024年小学英语老师的个人工作计划
- 2024年中学教师师德工作计划
- 幼儿园小班个人教学工作计划
- 2024年1月美术初级班教学工作计划
- 2024开学新计划作文
- 整学期教学计划音乐模板集合
- 初中语文教研个人计划第二学期例文
- 如何在公司中实现自我价值课件
- 最全逆做法顶管井专项施工方案
- 护理部不良事件记录本
- 乒乓球反手推档.课件
- 各少数民族的风俗习惯课件
- 优秀质量检验员培训教材
- 五年级下册道德与法治6《我参与我奉献》教学反思2篇
- 中国新闻事业发展史 第十四讲 社会主义新闻事业的曲折发展课件
- 部编版一年级上册语文期末试卷
- 梁祝音乐钢琴五线谱
- 班级卫生常规检查评分表
评论
0/150
提交评论