版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《应用多元统计分析》教学大纲课程名称:应用多元统计分析课程编号:F094092621英文名称:Appliedmultivariatestatisticalanalysis学时:48学时 学分:3学分开课学期:第5学期适用专业:数据科学与大数据专业课程类别:理论课课程性质:专业核心课先修课程:高等数学、线性代数、数据科学与大数据技术导论、数据采集与清洗、Python程序设计、概率论基础、数理统计一、课程的性质及任务《应用多元统计分析》课程是数据科学与大数据技术专业学生的一门专业核心课,是培养大数据科学技术人才整体知识结构的重要组成部分。通过本课程的学习,使学生能够了解多元统计分析在数据分析结构中的地位与作用;了解常见的数据类型;了解常见的数据分布与统计检验方法;能够理解多元正态分布中均值向量、协方差矩阵的意义,并掌握参数估计的计算方法;能够理解有监督学习与无监督学习的区别;能够应用线性降维方法对多指标数据进行降维,并进行后续的分类、评价等分析;能够应用对应分析方法对调查数据中的产品作定位分析、客户画像分析等;能够应用回归分析对影响因素重要性作分析,对研究问题的未来趋势作预测并为决策提供理论依据;具备综合应用多元统计分析中的分类方法、降维方法、相关方法等分析、解决各种多指标数据问题的能力。依据河北工程大学数据科学与大数据专业培养计划,本课程需要培养学生的能力是:能够基于数据科学与大数据技术原理,通过文献研究或相关方法,调研和分析大数据应用领域复杂工程问题的解决方案(毕业要求指标4-1)能够主动与其他学科背景的成员合作开展工作(毕业要求指标9-2)能及时跟踪大数据及相关行业发展状况,并就当前的热点问题发表自己的见解(毕业要求指标10-1)具有良好的表达能力和专业的描述方式,能够与业界同行及社会公众进行准确、高效的沟通和交流(毕业要求指标10-2)能够在大数据工程实践和研究活动中根据需要撰写工作报告、设计文档,以及口头汇报、演讲、谈判等(毕业要求指标10-4)二、课程目标与要求2.1课程目标培养学生正确的人生观、价值观,厚置学生爱国情怀。能理解数据类型,理解数据分布形态。能理解多元正态分布中总体参数的定义、几何意义、计算方法。能理解统计检验的思想,掌握统计检验的方法。掌握常用的多元统计分析方法的基本理论和实现方法,能够利用所学的统计分析方法分析实际经济社会、工程管理等领域案例,为其就业与继续深造打下必要而有用的基础。突出专业能力培养要求,使学生熟练掌握多元统计分析的常用方法,使学生具备一定的分析数据,处理数据和分析写作能力,为今后从事数据分析相关的工作打下良好的专业基础。提升学生的数据分析的科学素养,培养学生实事求是、科学创新、团结协作及吃苦耐劳的精神,奠定学生从事统计相关专业可持续发展的基础。提升学生实际动手能力,培养学生分析问题,解决问题,算法设计,科学创新精神,适应大数据时代和数字经济时代对人才的需求。
应用多元统计分析课程教学大纲PAGE16PAGE1942.2课程目标与毕业要求对应关系课程目标毕业要求二级指标毕业要求12345678●●●●4-2能够针对智能信息系统设计、大数据技术应用等大数据应用领域的复杂工程问题设计实验方案、构建实验系统和测试平台、获得实验结果4.工程技术研究能力:能够基于数据科学与大数据技术原理并采用科学方法对大数据应用领域的复杂工程问题进行研究,包括设计实验、分析与解释数据、并通过信息综合得到合理有效的结论。●●9-2能够主动与其他学科背景的成员合作开展工作9.个人和团队:具有健康的体魄和良好的综合素质,能够正确理解多学科背景下团队中个体、团队成员以及负责人的角色,并承担其责任与义务●10-1能及时跟踪大数据及相关行业发展状况,并就当前的热点问题发表自己的见解10.沟通与交流:具有沟通的能力、方法和技巧,能够就大数据应用领域的复杂工程问题与业界同行及社会公众进行有效沟通和交流,包括撰写报告及设计文稿,清晰表达和答辩;并具备一定的国际视野,能够在跨文化背景下进行沟通和交流。●●●10-2具有良好的表达能力和专业的描述方式,能够与业界同行及社会公众进行准确、高效的沟通和交流●10-4能够在大数据工程实践和研究活动中根据需要撰写工作报告、设计文档,以及口头汇报、演讲、谈判等2.3课程目标与培养环节对应矩阵序号课程目标理论教学课内实验课后作业1培养学生正确的人生观、价值观,厚置学生爱国情怀。H2能理解数据类型,理解数据分布形态。HL3能理解多元正态分布中总体参数的定义、几何意义、计算方法。HL4能理解统计检验的思想,掌握统计检验的方法。HL5掌握常用的多元统计分析方法的基本理论和实现方法,能够利用所学的统计分析方法分析实际经济社会、工程管理等领域案例,为其就业与继续深造打下必要而有用的基础。HML6突出专业能力培养要求,使学生熟练掌握多元统计分析的常用方法,使学生具备一定的分析数据,处理数据和分析写作能力,为今后从事数据分析相关的工作打下良好的专业基础。HMM7提升学生的数据分析科学素养,培养学生实事求是、科学创新、团结协作及吃苦耐劳的精神,奠定学生从事统计相关专业可持续发展的基础。HMM8提升学生实际动手能力,培养学生分析问题,解决问题,算法设计,科学创新精神,适应大数据时代和数字经济时代对人才的需求。HHL注:H表示该能力的在此环节重点培养;M表示该能力在此环节有应用要求;L表示该能力在此环节有所涉及。分布式存储与计算课程教学大纲PAGE2PAGE2072.4目标达成度的评价课程目标1主要通过教师的言传身教,在学生日常行为中有所涉及。主要通过课堂讨论、课后交流、实验报告的进行考核。目标达成综合以上内容进行评价。课程目标2、3、4、5主要通过理论教学环节进行培养,在课后作业中有所涉及。主要通过课堂测试、课后作业和期末考试中概念性、原理性题目进行考核。目标达成综合以上内容进行评价。课程目标6主要通过理论教学环节、课后作业进行培养,在课后作业和课内实验中有应用要求。主要通过课堂测试,课后作业和期末考试中对多元数据分析原理、思想、数学模型、算法设计等进行考核,在实验中体现为能根据实验目的对实验数据进行综合分析。目标达成综合以上内容进行评价。课程目标7主要通过理论教学环节进行培养,在课后作业和课内实验中有应用要求。主要通过课堂测试、课后作业中参数计算、性质分析等题目进行考核,在实验报告中体现为能给出符合要求的数值化结果、图形化表示等。目标达成综合以上内容进行评价。课程目标8主要通过课内实验培养,在课后作业中有所涉及。在课后作业中体现为能够按照要求完成算法设计;在实验报告中要对实验过程进行描述、对实验数据的处理与解释、对实验结果的评价结论。目标达成综合以上内容进行评价。三、教学方法及手段理论教学以课堂讲授为主,面向基础知识的准确、扎实掌握,突出对原理的分析、对方法的总结以及理论体系的完整建立;理论教学强调将各种数据分析方法与工程管理中的实际情况紧密联系,面向知识的实际应用;理论教学注重本课程与线性代数、数据科学与大数据技术导论、数据采集与清洗、Python程序设计、概率论基础、数理统计等先修课程的联系,以工程管理中的数据问题作为本课程知识的应用背景,结合多元数据分析原理的相关理论解释本课程的有关概念和原理,基于数据分析的基础知识掌握多元数据分析、算法设计与实验设计。理论教学与课内练习相结合,进行多元数据分析的应用与训练。课程强调学生的自主学习,强调通过自学的方式消化、吸收课程的庞大知识量,并在此基础上举一反三。四、课程的基本内容与教学要求第1章绪论[教学目的与要求]:了解多元统计学的发展过程和现状,了解多元统计分析的学习内容及应用背景,掌握常见的数据类型及其分类依据,掌握常见的数据预处理方法,掌握矩阵特征值、特征向量的计算方法及其几何意义。[本章主要内容]:1.1多元统计学(支撑课程目标1)1.2数据预处理(支撑课程目标2)1.3矩阵谱理论(支撑课程目标1)[本章重点]:数据类型及分类依据。数据预处理方法。矩阵特征值、特征向量。[本章难点]:数据类型的分类及转化。第2章多元正态分布[教学目的与要求]:了解数据分布类型及其意义,掌握多元正态分布的概念、参数性质、参数几何意义、参数的估计方法。[本章主要内容]:2.1正态分布(支撑课程目标3)2.2总体参数性质(支撑课程目标3)2.3参数估计(支撑课程目标3)[本章重点]:多指标问题、统计向量。多元数据分布类型。多元正态分布定义。均值向量、协方差、协方差矩阵、相关系数。独立性与相关性。总体均值、总体方差、相关矩阵的性质及计算。总体参数估计。协方差、相关系数的几何意义与应用。多元数据预处理方法。[本章难点]:协方差的计算与几何意义。相关系数的计算与几何意义。相关与独立的关系。第3章分布与检验[教学目的与要求]:了解常见的统计量分布类型,掌握假设检验的思想和方法,掌握均值向量的假设检验思想和方法,掌握协方差矩阵的假设检验思想和方法,掌握常见统计检验方法,能够根据数据类型选择检验方法。[本章主要内容]:3.1抽样分布(支撑课程目标4)3.2均值向量的检验(支撑课程目标4)3.3协方差矩阵的检验(支撑课程目标4)3.4统计检验(支撑课程目标4)[本章重点]:统计量的分布。假设检验的思想。假设检验的步骤。假设检验的解读。均值向量检验。协方差矩阵检验。统计检验。[本章难点]:统计分布。统计检验。第4章聚类分析[教学目的与要求]:了解聚类分析的思想、原理、背景及应用领域,了解聚类分析的研究目的和分析方法,掌握样品距离和指标距离的判定方法及异同点,掌握欧式距离与马氏距离的异同,掌握5种类间距的定义,掌握树状图与冰柱图的含义,掌握系统聚类法、K-均值聚类法的原理与方法。[本章主要内容]:4.1聚类分析(支撑课程目标1、5)4.2距离和相似性度量(支撑课程目标5、6、7)4.3系统聚类法(支撑课程目标5、6、7、8)4.4K-均值聚类法(支撑课程目标5、6、7、8)[本章重点]:距离和相似度。欧氏距离与马氏距离。Pearson相关、Spearman相关、Kendall相关。树状图和冰柱图。五种类间距。六种聚类法。系统聚类法。K-均值聚类法。[本章难点]:样品距离和类间距离。距离和相似性。系统聚类。第5章判别分析[教学目的与要求]:了解有监督学习与无监督学习,了解有监督判别与无监督判别,了解常用的判别分析方法,了解常见的机器学习算法,掌握距离判别法、贝叶斯判别法、Fisher判别法、线性判别法。[本章主要内容]:5.1距离判别(支撑课程目标5、6、7、8)5.2贝叶斯判别(支撑课程目标5、6、7、8)5.3Fisher判别(支撑课程目标5、6、7、8)5.4线性判别(支撑课程目标5、6、7、8)[本章重点]:监督判别与无监督判别。距离判别。Bayes最大后验准则。Bayes最小误判准则。Fisher判别。线性判别。[本章难点]:Bayes最大后验准则。Bayes最小误判准则。Fisher判别。第6章主成份分析[教学目的与要求]:了解主成份分析的思想、数学原理,掌握由协方差矩阵、相关矩阵求主成份的数学模型,掌握主成份分析的性质,掌握主成份评价的方法。[本章主要内容]:6.1主成份模型(支撑课程目标5、6、7、8)6.2主成份性质(支撑课程目标5、6、7、8)6.3主成份评价(支撑课程目标5、6、7、8)[本章重点]:主成份分析思想。主成份分析数学原理。主成份分析数学模型。主成份分析性质。主成份评价。[本章难点]:数学原理。数学模型。性质及应用。第7章因子分析[教学目的与要求]:了解因子分析的思想、数学原理,掌握因子分析的数学模型,掌握因子分析的性质,掌握因子评价的方法。[本章主要内容]:6.1因子分析模型(支撑课程目标5、6、7、8)6.2因子分析步骤(支撑课程目标5、6、7、8)[本章重点]:1.因子分析与主成份分析异同。2.因子分析数学原理。3.因子分析数学模型。4.影响分析性质。5.因子评价。[本章难点]:1.数学原理。2.数学模型。3.性质及应用。五、课内实验5.1本课程实验教学的地位和作用多元统计实验是巩固和扩展课程理论知识的必要环节。理解统计数据指标类型。掌握统计数据预处理方法。能够应用Python函数库或者编程分析统计数据。能根据实验目的对实验数据作聚类分析、判别分析、主成份分析、因子分析。通过实验提高学生应用多元统计分析方法解决统计数据分析问题的能力,锻炼学生分析问题、解决问题、实验设计、程序设计以及撰写实验报告的能力。5.2教学基本要求通过实验预习及设计,理解多元统计数据分析的基本原理和一般实验设计准则,能够熟练应用Python软件,为实验的顺利开展奠定基础。根据聚类分析、判别分析、主成份分析、因子分析的原理和数学模型,调用Python函数或编程处理多元统计数据的分类、降维、评价等问题,能够根据实验目的分析实验结果,并根据实验结果撰写实验报告。5.3实验内容及要求大纲基本内容包括四个实验项目,在16个学时内完成。实验一聚类分析通过实验让学生掌握系统聚类、K-均值聚类的实验过程,实验结果的解读,实验目的的分析,实验报告的撰写。培养学生分析数据、处理数据、解读数据的能力。要求学生课前预习实验指导书,根据实验指导书提供的数据背景知识并参考课程所用教材完成实验过程模拟,实现相应理论知识的理解。指导教师为学生提供实验数据,具体实验步骤和结果分析、处理由学生独立完成。实验内容要求如下:课前预习内容:系统聚类的原理与步骤。树状图与冰柱图的意义。K-均值聚类的步骤。类的判别方法。实验内容:根据提供的实验数据,应用Python软件,通过调用函数或编程应用系统聚类和K-均值聚类方法实现对样品数据的分类,通过冰柱图、树状图解读分类过程,根据研究目的选择分类数,实现对实验数据的分类。实验要求:能够熟练使用Python软件,能够理解实验目的、读懂实验数据,能够将实验结果可视化,通过对实验结果的解读,实现对样品数据的分类,并根据实验目的、实验要求撰写实验报告。实验二判别分析通过实验让学生掌握距离判别、贝叶斯判别、Fisher判别、线性判别的实验过程,实验结果的解读,实验目的的分析,实验报告的撰写。培养学生分析数据、处理数据、解读数据的能力。要求学生课前预习实验指导书,根据实验指导书提供的数据背景知识并参考课程所用教材完成实验过程模拟,实现相应理论知识的理解。指导教师为学生提供实验数据,具体实验步骤和结果分析、处理由学生独立完成。实验内容要求如下:课前预习内容:判别分析的思想。距离判别的实现过程。贝叶斯最大后验准则和最小误判准则。Fisher判别准则线性判别准则。实验内容:根据提供的实验数据,应用Python软件,通过调用函数或编程应用距离判别、贝叶斯判别、Fisher判别、线性判别方法实现对样品数据的分类,根据研究目的实验对样品数据的分类。实验要求:能够熟练使用Python软件,能够理解实验目的、读懂实验数据,能够将实验结果可视化,通过对实验结果的解读,实现对样品数据的分类,并根据实验目的、实验要求撰写实验报告。实验三主成份分析通过实验让学生掌握主成份降维、主成份评价的实验过程,实验结果的解读,实验目的的分析,实验报告的撰写。培养学生分析数据、处理数据、解读数据的能力。要求学生课前预习实验指导书,根据实验指导书提供的数据背景知识并参考课程所用教材完成实验过程模拟,实现相应理论知识的理解。指导教师为学生提供实验数据,具体实验步骤和结果分析、处理由学生独立完成。实验内容要求如下:课前预习内容:主成份分析的原理与步骤。碎石图意义。方差表的意义。成分矩阵。实验内容:根据提供的实验数据,应用Python软件,通过调用函数或编程应用主成份降维、主成份评价方法实现对指标数据的降维,对样品数据的排序,通过碎石图、方差表、成分矩阵解读,实现对数据降维与评价的目的。实验要求:能够熟练使用Python软件,能够理解实验目的、读懂实验数据,能够将实验结果可视化,通过对实验结果的解读,实现数据降维与评价,并根据实验目的、实验要求撰写实验报告。实验四因子分析通过实验让学生掌握因子分析、因子评价的实验过程,实验结果的解读,实验目的的分析,实验报告的撰写。培养学生分析数据、处理数据、解读数据的能力。要求学生课前预习实验指导书,根据实验指导书提供的数据背景知识并参考课程所用教材完成实验过程模拟,实现相应理论知识的理解。指导教师为学生提供实验数据,具体实验步骤和结果分析、处理由学生独立完成。实验内容要求如下:课前预习内容:因子分析的原理与步骤。因子载荷意义。成分矩阵。旋转成分矩阵。实验内容:根据提供的实验数据,应用Python软件,通过调用函数或编程应用因子降维、因子评价方法实现对指标数据的降维,对样品数据的排序,通过碎石图、方差表、成分矩阵、旋转成分矩阵解读,实现对数据降维与评价的目的。实验要求:能够熟练使用Python软件,能够理解实验目的、读懂实验数据,能够将实验结果可视化,通过对实验结果的解读,实现数据降维与评价,并根据实验目的、实验要求撰写实验报告。5.4教学文件及教学形式教学文件:自编《多元统计分析实验指导书》。教学形式主要包括:预习、课堂指导与实验操作、撰写实验报告。实验报告学生自拟。实验报告包括:实验名称、实验目的及要求、实验描述及实验过程、实验结果及解释、总结及评价,要有完整的实验数据、实验过程、实验结果、算法程序,用图表表示的实验结果,以理论联系实际为出发点,解读实验结果,总结实验中出现的问题及解决方法。5.5实验项目及学时分配序号实验项目实验学时实验类型实验类别实验性质1系统聚类2验证专业必修2K-均值聚类2验证专业必修3距离判别、2验证专业必修4Fisher判别2验证专业必修5贝叶斯判别2验证专业必修6主成份分析2验证专业必修7因子分析2验证专业必修8综合评价2验证专业必修5.6本课程实验用到的仪器设备及仪表电脑、Python软件。六、课程学时分配教学课次教学内容教学环节与计划时数教学环节计划时数1绪论理论课22正态分布理论课23总体参数理论课24参数估计理论课25抽样分布理论课26均值向量检验、协方差检验理论课27统计检验理论课28聚类分析、距离和相似性度量理论课29系统聚类理论课210K-均值聚类理论课211距离判别、贝叶斯判别理论课212Fisher判别、线性判别理论课213主成份模型理论课214主成份性质与评价理论课215因子分析模型理论课216因子分析步骤理论课217实验一聚类分析实验课418实验二判别分析实验课419实验三主成份分析实验课420实验四因子分析实验课4七、课程考核与成绩评定7.1考核方式考核环节包括课程学习过程考核和期末考试,其中课程过程考核占总成绩的40%,分别由课堂表现、课后作业、实验情况进行评定;期末考试成绩占总成绩的60%。各环节的比重如下。考核环节比重合计过程考核(平时成绩)课堂表现10%50%作业10%实验30%期末成绩期末测试50%50%总计100%100%7.2考核内容及要求本课程为考试课。考核内容及分值分配如下。考核方式考核内容分值课程目标总分值期末考试50%数据类型与数据预处理2~4目标2100分聚类分析的思想2~5目标1判别分析的思想5~15目标1主成份分析的思想5~15目标1因子分析的思想5~10目标1信均值向量、协方差矩阵的计算10~20目标2、3、4、5聚类、判别的性质5~15目标5、6、7、8主成份与因子的性质15~30目标5、6、7、8过程考核50%课堂表现课堂测试、出勤情况10目标1、2、3、4、5、6、7、810分课后作业作业完成情况10目标2、3、4、6、7、810分实验实验出勤、算法设计及实验报告30目标5、6、7、8100分7.3成绩评定1.课堂表现课堂表现总分10分,由课堂测试与课堂出勤情况评定。其中,课堂测试满分5分,以客观题(填空、选择、判断)为主,每学期随堂测试10~20次,每次测试1~2道题目,每答错一道题目扣0.5分(直到扣满5分为止);课堂出勤满分5分,缺勤一次扣1分,迟到或请假扣0.5分。2.课后作业课后作业总分10分,由作业完成情况评定。每学期布置作业5次,每次作业占2分,评分标准如下;评分标准分值标准描述课后作业2能够按时认真完成作业、作业态度认真、书写清楚、分析计算正确。1.5能够按时完成作业、作业态度较好、书写清楚、分析计算基本正确1能够按时完成作业、作业态度一般、书写清楚、分析计算错误较多0.5能够按时完成作业、作业态度一般、书写不清楚、分析计算错误较多0不交作业或作业态度不认真、抄袭他人作业3.实验成绩实验成绩占所学课程的30%,即30分。根据学生的实验表现及实验报告结果,进行综合评定。具体评分标准如下表所示。评分标准分值标准描述实验表现(10)10无迟到、早退现象,态度端正,积极回答问题。8无迟到、早退现象,实验过程相对认真,但不积极回答问题。6无迟到、早退现象,实验过程不认真。4有迟到、早退现象,实验过程不认真。2有迟到、早退现象,实验过程不动手,浑水摸鱼0旷课实验报告(20)10有完整正确的实验原理图,实验过程叙述
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 代理保险业务突发事件应急预案(2篇)
- 行政后勤部职责范围(4篇)
- 2025年村委工作计划模版(3篇)
- 火灾高危单位消防安全管理规定(3篇)
- 2025年学校综合治理工作计划例文(6篇)
- 中学周边环境综合治理制度模版(2篇)
- 【正版授权】 ISO/TR 25221:2025 EN Electronic fee collection - Image-based tolling systems - Measurable characteristics
- 2024年短期租房合同范本
- 2024年石油化工产品购销合同
- 2024年生态修复补植补造合同2篇
- 雨雪天气安全教育PPT
- 深基坑支护专项施工方案(咬合桩)
- 劳务派遣服务外包技术方案
- 采购管理实务全套教学课件
- 极致物业管理系统收费管理业务操作
- GB∕T 29639-2020 生产经营单位生产安全事故应急预案编制导则
- 贵州省工伤保险待遇申领授权委托书
- 媒介融合(ppt)课件
- 液压系统中油管尺寸的选择
- 视频监控台账参考模板
- 初一初三国家体育锻炼标准评分表
评论
0/150
提交评论