智慧校园大数据平台建设和运营整体解决方案_第1页
智慧校园大数据平台建设和运营整体解决方案_第2页
智慧校园大数据平台建设和运营整体解决方案_第3页
智慧校园大数据平台建设和运营整体解决方案_第4页
智慧校园大数据平台建设和运营整体解决方案_第5页
已阅读5页,还剩452页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

智慧校园大数据云平台建设和运营整体解决方案智慧校园大数据平台建设和运营一体化整体解决方案V6.01智慧校园大数据云平台建设方案目录TOC\o"1-6"\h\z\u第1章 建设思路和建设目标 智慧校园大数据总体规划2015年是中国的智慧校园大数据元年,政府、企业、学校、研究者、管理者、教师、社会公众等都开始关注智慧校园大数据,相关政策文件、研究机构、学术活动、市场产品等开始纷纷出现。然而,我国的智慧校园大数据研究与实践领域整体还处于起步探索阶段,是在“摸着石头过河”,涉及一系列关键问题亟待解决(如教育数据的自然采集、教育数据的安全管理与隐私保护、教育数据的无缝流转与开放共享、教育数据的深度挖掘以及学习分析等)。其中,教育数据的全面、自然、动态、持续采集是构建智慧校园大数据的基础性和先导性工作,这就需要厘清一些基本问题:教育数据的产生源头在哪里?哪些数据需要采集?有哪些常用的数据采集技术?采集时需要注意什么?大数据发展分析智慧校园大数据建设背景战略机遇培养大数据人才、利用智慧校园大数据深化智慧校园管理促进智慧校园改革发展、使用大数据平台提高智慧校园科研水平和效率,既是智慧校园面临的重要任务,也是智慧校园发展的战略机遇。大数据正在逐渐成为社会基础设施,成为每一家组织机构的标配。“大数据”之“大”,更多的意义在于:人类可以“分析和利用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,并让很多常态化的认知、判断、思维定式、产品形态、服务模式,形成全新的面貌和演进方向。

大数据已经引起国际社会的高度重视,世界各国都在加快推进大数据战略布局。大数据产业已上升至国家战略高度,正日益渗透到经济发展和社会生活的方方面面。2015年9月5日,国务院发布《促进大数据发展行动纲要》,文件指出“数据已经成为国家基础性战略资源”,并在启动的十大工程之一“公共服务大数据工程”中明确提出要建设教育文化大数据。

智慧校园大数据已经上升到国家战略层面,引起社会各界的广泛关注和高度重视。智慧校园大数据将首先破解传统教育面临的六大难题(发展不均衡难题、方式单调化难题、信息隐形化难题、决策粗放化难题、择校感性化难题、就业盲目化难题),助推教育的全方位变革与创新发展。

确立智慧校园大数据在我国教育事业发展与改革中的战略地位已是国家教育现代化建设的必然要求。智慧校园大数据是重要的国家战略资产、教育领域综合改革的科学力量与发展智慧校园的基石。

人类社会已经迎来“大数据时代”。培养大数据人才、利用智慧校园大数据深化智慧校园管理促进智慧校园改革发展、使用大数据平台提高智慧校园科研水平和效率,既是智慧校园面临的重要任务,也是智慧校园发展的战略机遇。大数据产业政策支持目前政策对大数据的支持力度正不断提升,大数据已上升至国家战略。自去年3月“大数据”首次出现在《政府工作报告》中以来,国务院常务会议一年内6次提及大数据运用。在6月17日的国务院常务会议上,总理李克强再次强调大数据运用的重要性。7月1日,国务院办公厅印发了《关于运用大数据加强对市场主体服务和监管的若干意见》。9月5日电经李克强总理签批,国务院日前印发《促进大数据发展行动纲要》,系统部署大数据发展工作。其中,也提到了智慧校园大数据系统的建设。2015年12月21日,《中国基础智慧校园大数据发展白皮书》首次研讨会在京召开,对全国智慧校园大数据的建设给予探索和指导参考意义。智慧校园大数据的来源教育是一个超复杂的系统,涉及教学、管理、教研、服务等诸多业务。与金融系统具有清晰、规范、一致化的业务流程所不同的是,不同地区、不同学校的教育业务虽然具有一定的共性,但差异性也很突出,而业务的差异性直接导致教育数据来源更加多元、数据采集更加复杂。智慧校园大数据产生于各种教育实践活动,既包括校园环境下的教学活动、管理活动、科研活动以及校园生活,也包括家庭、社区、博物馆、图书馆等非正式环境下的学习活动;既包括线上的教育教学活动,也包括线下的教育教学活动。智慧校园大数据的核心数据源头是“人”和“物”——“人”包括学生、教师、管理者和家长,“物”包括信息系统校园网站、服务器、多媒体设备等各种教育装备。依据来源和范围的不同,可以将智慧校园大数据分为个体智慧校园大数据、课程智慧校园大数据、班级智慧校园大数据、学校智慧校园大数据、区域智慧校园大数据、国家智慧校园大数据等六种,它们从下向上、从小到大逐级汇聚:个体智慧校园大数据包括教育部2012年正式发布的《教育管理信息化系列行业标准(教技[2012]3号)》中规定采集的教职工与学生的基础信息、用户各种行为数据(如学生随时随地的学习行为记录、管理人员的各种操作行为记录、教师的教学行为记录等)以及用户状态描述数据(如学习兴趣、动机、健康状况等)。课程智慧校园大数据是指围绕课程教学而产生的相关教育数据,包括课程基本信息、课程成员、课程资源、课程作业、师生交互行为、课程考核等数据,其中课程成员数据来自个体层,用于描述与学生课程学习相关的个人信息。班级智慧校园大数据是指以班级为单位采集的各种教育数据,包括班级每位学生的作业数据、考试数据、各门课程学习数据、课堂实录数据、班级管理数据等。学校智慧校园大数据主要包括标准规定的各种学校管理数据(如概况、学生管理、办公管理、科研管理、财务管理等)、课堂教学数据、教务数据、校园安全数据、设备使用与维护数据、教室实验室等使用数据、学校能耗数据以及校园生活数据。区域智慧校园大数据主要来自学校以及社会培训与在线教育机构,包括国家标准规定的教育行政管理数据、区域教育云平台产生的各种行为与结果数据、区域教研等所需的各种教育资源、各种区域层面开展的教学教研与学生竞赛活动数据以及各种社会培训与在线教育活动数据。国家智慧校园大数据主要汇聚了来自各区域产生的各种教育数据,侧重教育管理类数据。智慧校园大数据采集技术图谱教育数据的采集需要综合应用多种技术,每种技术采集的数据范围和重点都有所不同。图2展示了教育数据采集的技术体系,共包括4大类、13种常见数据采集技术。智慧校园大数据建设面临问题大数据是智慧校园行业跃迁的新变量,但目前也面临着诸多挑战:产品同质化严重主要以考量测评类产品为主,重点聚焦于如何“提分”;盲目跟风现象严重,产品同质化且差异不大。分析端是整体短板目前的产品多集中在关系维系端和数据存储端,缺乏深度数据分析;教育行业数据半结构化、非结构化突出,在分析端技术整体不成熟。缺乏统一的行业标准行业正在重走教育信息化早期发展阶段的“老路”,盲目混乱发展;专门针对智慧校园大数据的标准制定工作还未正式启动。大数据价值尚未体现整个行业缺乏有影响的大数据实践案例,普遍对价值认可不足;缺乏有影响案例的情况下,大数据定价缺乏依据和标准。数据模型的科学性不足教育业务具有异常的复杂性和独特性,目前大多数产品仅靠IT思路构建教育数据库,在数据源选择和指标、权重设计方面往往脱离实际。数据的权利制度未明确教育数据的归属权、开放范围、开放方式、隐私保护等还无清晰界定;在提供教育数据产品与服务中,往往存在极大的政策风险。数据规模日益庞大数据来源多元化,共享数据库涵盖系统多,智慧校园生源不断扩张,信息不断积累,致使数据库中的信息不断增加,进而为数据挖掘、管理和分析带来了困难。缺乏稳定高效的大数据环境智慧校园不同学科与专业采用的大数据环境大多依赖现有的IT环境,导致大数据运行的基础软硬件环境比较混乱且极其不稳定,缺乏有效的运维管理,严重影响教学和科研工作的正常进行。数据利用不充分校园的信息仍然停留在收集和累积阶段,尽管移动终端系统的不断发展为信息采集带来了极大的便利,但采集后的数据仅仅停留在查询阶段,并没有对数据进行整合、分析和梳理,使得这些信息仍未被管理者采用,作为决策依据的信息则少之又少。数据驱动带来的科研新挑战数据剧增由量变引起质变,使科研人员的思维和行为模式在传统的学科研究领域发生转变。如何借助大数据相关技术以及资源,找到本学科研究成果的新视角,已经成为当前智慧校园研究的重要课题。智慧校园大数据云平台建设原则数据采集是建设智慧校园大数据的基础性、先导性工作。随着很多新型技术(如眼动追踪技术、语音交互技术、体感技术等)的逐步成熟,将有越来越多的数据采集技术应用到教育领域,推动智慧校园大数据更加实时、连续、便捷的采集。为了保证高质量教育数据的可持续性采集,教育数据采集在实践过程中需要注意如下事项:要提前规划设计智慧校园大数据的建设与应用是一项系统工程,需要进行顶层设计,以便有目的、有序地采集高质量教育数据。规划设计的内容包括:数据采集的范围、使用的数据采集技术、数据采集环境的部署、数据采集质量的保障措施、采集数据的应用目的和场景、数据的存储方案、数据的更新机制、数据的交换标准等。不同层级的教育数据采集应当有不同的侧重点——国家智慧校园大数据和区域智慧校园大数据应以管理类数据采集为主,同时注重与社会、医疗、交通等领域大数据的关联交叉分析与挖掘,重点服务教育政策的制定以及区域教育的均衡发展;学校、班级、课程大数据应以教与学活动数据采集为主,重点服务教学质量的提升;个体大数据应以学习者个体的行为数据、状态数据、情境数据等采集为主,重点服务学习者的个性化学习诊断和发展。要有清晰的边界大数据虽然具有混杂性、来源多样性等特征,数据的存储成本也越来越低,但并非要囊括一切数据,没有价值的数据是不值得收集和分析的。智慧校园大数据同样如此,其采集应当有清晰的边界,而非盲目采集任何教育活动数据。究竟要采集哪些数据,取决于数据的应用目的。举个例子,为了检测评估学生的学习进展,就需要对课程浏览、作业练习、交流互动、提问答疑等数据进行实时采集和分析,而不必采集学生的饮食、运动等数据。当然,我们并不否认饮食、运动等数据在诊断学生体质状况方面的价值。这里所提的“数据边界”是相对于具体的应用目的而言的,任何数据分析模型的构建都需要依赖特定的数据集合,唯有如此才能保证分析模型的有效性和分析结果的应用价值。要保持连续性和规范性很多时候,仅凭某个学生的一次作业成绩并不能说明什么问题,但如果将一个班级每位学生历次的作业成绩甚至作业的过程数据都全部采集到,便可以客观评估学生的整体学习效果、发现学习盲点、诊断教学难点,开展针对性教学和个别化辅导,这时的作业数据便具有了“大”价值。智慧校园大数据的采集应秉持“持续创造价值,规范提升价值”的理念。教育数据的采集一方面应当保持连续性,即根据前期规划设计,定期、连续、有规律地采集各种教育数据,通过长时间累计从小数据生成大数据;另一方面,为了保证后期数据的融通互换和一致化处理,教育数据的采集应遵循特定的技术标准和规范。目前,全国信息技术标准化技术委员会教育技术分技术委员会已在教育信息化标准研制方面做了大量的工作,有些技术标准已经成为国标,各应用系统的研发应当遵循教育管理信息化标准、教育资源建设标准等。此外,国际上一些通用标准也值得借鉴,如IMS-QTI(问题与测试交互)标准、xAPI(学习体验记录)规范等。采集粒度要尽可能小数据粒度是指数据的细化和综合程度。一般来说,细化程度越高,粒度越小;细化程度越低,粒度越大。数据采集应处于一个合适的粒度级别,粒度的级别既不能太高也不能太低。这是因为,低的粒度级别能提供详尽的数据,但要占用较多的存储空间、需要较长的查询时间;高的粒度级别能快速方便地进行查询,但不能提供过细的数据。就智慧校园大数据采集而言,在保证数据有效性的基础上,数据粒度应尽可能细,以便从中挖掘更多的潜在价值。传统的教育数据以分数为核心,一份作业、一张试卷最后采集到的仅仅是一个表征成绩的数字符号,即采集的数据粒度比较大。如果基于在线学习平台或点阵数码笔技术能够采集到每个学生的答题过程,如做题的顺序、每道题的停留时间、答案修改次数等更细化的过程记录数据,便能更加精准地判断学生在哪些知识点存有疑惑和答错的具体原因(马虎大意还是未掌握知识)。因此,可以说“小颗粒汇聚大数据,大数据蕴藏大价值”。智慧校园大数据数据源分析数据涉及面窄主要是数字化校园系统产生数据数据的维度少,业务来源不足有效数据量少数据量百GB到几TB,数据量少以结构化数据为主,达不到大数据要求数据接口不完善部份数据源有错误,数据不一致业务接口与数据结构不规范智慧校园大数据服务用户分析智慧校园类似一个小社会,用户群体较多,各部门都存在大数据需求,而关注的内容会有较大的区别。比如校领导关注全校基础数据和总体情况,用于战略决策与发展评估。管理部门关注学生的生活、消费和心理状态。教学部门关注学生成绩情况、教师教学质量和学生满意度等。因此,这些特点决定了高教大数据的应用模块和类型会比较丰富。智慧校园大数据建设责任制问题智慧校园的特点是数量据并不算大,几万人规模的数据比起我们之前参与的电信几百万人的规模来说不算大,但数据源丰富,而且重视数据关联分析。现阶段有些智慧校园的大数据是由某些学院自已在搞,没有从全校的层面来进行统一部署,数据处于割裂的状态,大数据价值不明显。智慧校园大数据在很多学校属于一把手工程,需要由学校高层领导牵头,协调和部门的数据,并进行统一的顶层设计和全校规划,由具体的单位比如网络中心来落地建设。校领导决策更加科学。教师教学更加便捷教学水平提升学生随时随地个性化学习。家长及时掌握子女在校情况。校园环境更加绿色、环保、安全信息化覆盖范围和服务水平有效提升教学管理与服务管理更加简单高效服务水平不断提升社会更多优质教育资源和科研成果开放共享建设目标实现数据的共享和交换将学校各应用系统的数据进行集成和整合,使来源各异、种类不一的各类数据可以相互使用,丰富数据的来源,打破系统间的信息孤岛,实现数据的共享和应用。大数据的采集和存储研制数据适配接口,对接校内各应用系统获取各类异构数据,并采用大数据主流的框架和系统对数据进行统一存储,为数据的挖掘和分析打好基础。大数据分析与决策采用数据挖掘、数理统计等相关技术,构建大数据分析框架,提取数据中隐含的、未知的、极具潜在应用价值的信息和规律,为学校的教务管理、科研管理、学生管理、后勤管理等各项工作提供决策和指导。智慧校园大数据平台建设意义智慧校园作为高科技人才以及创新技术的摇篮,承载着科研攻关和人才培养的双重使命。在新的科技浪潮中,智慧校园应瞄准时代最前沿,将教学科研创新、专业人才培养与大数据紧密融合在一起,在更高起点上推动学校在大数据教学、科研以及创新方面再上新台阶。实现个性化学习集成教育数据挖掘与学习分析技术,持续采集学习行为数据,智能分析,推送适合的学习资源并进行个性化学习建议。实现教育评价体系重构采集教与学的全过程数据,全面客观记录学生成长轨迹,引导学生培养模式和教育质量管理方式科学健康发展。实现科学研究范式转型解决科研经费等科研管理难题,提供便捷的技术支撑与人性化服务,提高研究的效率和结果的可信度。开启“大数据创客”新模式完成创新应用及发布,完善智慧校园信息化建设,提升智慧校园实力,加速创客成果转化,推动创意实现产业化,打造具有影响力的“创客校园”。实现教学模式改革教学数据分析与预测,改变教学模式,实现个性化教育,调整教学方案,优化教学方法,提高教学质量。实现科学化教育管理注重相关关系识别,强调因果关系的确定,发现隐藏的、有用的信息,做好教育管理和决策工作的数据支持。智慧校园大数据需求分析政府部门政府部门依据统计报表制定各种指标,指导教育发展工作,而利用大数据技术采集、挖掘、分析这类数据能够更好地量化教育现状,并用作制定教育资源分配建议、教育管理政策。资源分配分析某市、某省甚至全国生师比现状与教学效果的关联性,得出最佳生师比或指导性生师比,以此指导各地教师调动的相应政策;分析学校农村学生寄宿生比例,指导新校选址、旧校裁撤等事宜;对某智慧校园教室、实验室的空置率或利用率做大数据分析,并依据分析结果权衡场地资源的再分配,将属于某班级/年级/院系空置率高(利用率低)的场地调拨给其他场地使用紧张的班级/年级/院系。教育管理在学生综合评价中,可先从学生体质健康达标率入手,配合专用传感器,获取学生体质相关数据,运用大数据技术分析学生体质与学生锻炼时间、强度等内容的相关性模型,并依此提出教学建议;通过对专任教师培训次数(人次/百人)指标的分析,探讨教师继续培训与教学质量的相关性;分析进城务工人员随迁子女的入学比例与该地经济发展、政策变动、人均收入增长等因素的相关性,得出与教学管理方案(新建学校、教师调动等)关联的模型,指导教育部门制定合理的教学管理方案。教师教学资源精准投放教学资源精准投放,即准确搜寻所需教案、教学课件、教学视频或问题学生应对方法等,在搜寻过程中还可参考课程大数据标签进行筛选,找到合适的教学资源。教师教学评价通过教师行为大数据分析(包括课程设计类型、教学思维回路图等),通过横向纵向大数据比较,找到教师自身教学过程的问题所在,进行针对性训练和辅导,最终得到教师教学评价。云题库建设建立云题库,并在年级、学科分类的基础上,运用大数据进行题目类型、知识点类型、难易程度、解题思路类型划分,并贴上题目标签。教师可根据课程标签进行智能组卷,或结合学生学习数据分析布置个性化作业。教师综合评估在多次教学反馈,学生学习反馈的基础上,形成教师综合评估报告,对教师教学类型、教学优势、教学缺陷、学生类型匹配等做出全方位评价。学生通过学生行为大数据分析,洞悉学生学习思维的问题所在,进行针对性训练提高。在学生弱项分析的基础上,结合行为数据分析,提出针对性具体性的学习建议甚至学习方案。对学生学习历程进行记录,根据学习进度精准推送所需教学资源。对目标明确的学习(如资格考试),执行大目标分解成小目标的学习计划,分析用户日常时间安排判断学习计划的可行性或提出学习时间安排建议。分析用户学习进度及特点,给出预测分数和学习提升建议。教学管理分析学生学习风格、能力模型、群体学习特点,对学生教学管理制度(如教学作息时刻表、教学设施建设等)给出指导意见;对学生教学管理制度(如教学作息时刻表、教学设施建设等)给出指导意见,对教师调配、教师教学能力提升做出具体要求;搜集学生行为数据(学生学习特点、时间安排等),通过大数据多维对比,找到问题学生(包括学习习惯问题、心理健康问题),及时做出针对性辅导。教育技术服务商平台技术服务商平台技术服务商的大数据技术用武之处应用需求甚多。对于平台技术服务商而言,最大的难点在于平台顶层设计,即准确把握用户需求和平台前景规划。大数据技术虽不能直接击中用户需求,但能快速精准地把握市场现状,并给出趋势预测分析。从这个角度上看,大数据技术对用户需求的把握比传统的问卷调查或实地调研更具参考性和实用性。因此,大数据技术对平台技术服务商的平台建设极具指导意义。语音识别技术服务商语音识别技术服务商大数据前景广阔,语音识别是一个热点领域,除了教育应用,还涉及众多领域。语音识别的关键技术指标是识别准确率和识别速度,而这两项指标都能通过大数据技术进行优化。在建立庞大的语音和词汇数据库的基础上,运用大数据技术匹配用户说话内容与语音库,并根据词汇数据库理解用户表达的意思。目前英语语音识别系统已经在使用过程中逐步完善,但汉语语音识别由于汉语的复杂性,存在技术瓶颈,产品开发亟待突破。目前国内教育领域语音识别技术龙头企业为科大讯飞,所有省份的口语评测采用的都是科大讯飞的引擎。物联网技术服务商物联网技术服务商大数据应用前景广阔。物联网技术和大数据技术是一对密不可分的兄弟,物联网采集的数据需要大数据技术做分析,而大数据技术的开展需要物联网技术进行数据采集。教育平台服务商平台服务商是未来教育线上产业链建设的重点,而教育行业未来发展趋势将是结合新型信息技术实现线上线下深度融合,因此大数据技术在平台服务商的应用被教育行业业内人士广泛看好。教育资源平台教育资源云存储,优质教育资源共享;教育资源标签化,方便教师和学生查找;资源精准推送。教育管理平台学生学习进度管理、学习情况管理、学情分析;教师布置作业、批阅试卷、上传课程资料等;师生双方的教学评估。O2O平台师生双方精准匹配;提高匹配效率。学习交流平台用户画像;交流伙伴匹配。用户用户即学生和家长,家长是教育行业的主要付费者,前面介绍了学生需求,因此这里只关注家长端的大数据应用。教育行业面向家长的业务主要在家校互动方面开展,可运用大数据技术在教育内容信息化的基础上将信息同步到家长端,家长反馈也可进行大数据聚类分析。教育行业面向家长的业务主要在家校互动方面开展,大数据技术可结合位置数据,在学生到校或到家时将抵达信息实时推送到家长端,变相解决教育行业安全问题。采集过程要符合伦理道德数据隐私与安全一直是大数据发展的障碍之一。教育数据的采集源头来自广大学生、教师、家长以及学校,数据繁杂多样,其中成绩、排名、家庭背景等诸多信息涉及个人隐私。目前,国内在教育数据隐私保护方面的法律法规还不健全,学校、教育机构等学生数据的保护意识亟待加强。由于监管不到位,教育行业中不乏一些为了商业利益而私售师生以及家长信息的不良企业。不管出于研究、管理还是商业目的,任何教育数据在采集之前,都应当遵循教育数据采集伦理道德规范(建议相关部门尽快编制),数据产生主体也应当享有一定的知情权和选择权。数据采集的初衷和最终目的应该本着“服务教育发展、服务师生成长”的智慧校园大数据应用场景分析政府部门生师比场景举例运用大数据技术分析山西省小学生师比后发现,全省小学生师比为13.12,其中生师比为12.60-13.40的学校教学质量普遍比其他学校更高,因此可以制定山西省指导性小学生师比为13.00.大数据还发现山西省南部生师比普遍高于13.00,北部生师比普遍低于13.00,因此山西省厅可制定小学教师资源向南部倾斜的政策。农村学生寄宿生比例场景举例黑龙江省农村学生寄宿生比例为32%,但教育资源浪费现象太严重,需考虑通过并校、撤校的方式将教育资源集中起来。甲村和乙村是邻村,通过大数据分析发现甲村寄宿生比例为20%,乙村寄宿生比例为50%,因此在考虑将甲村和乙村的学校合并时,由于乙村寄宿生比例较高,因此可撤掉乙村学校,鼓励原乙村学校学生全部转为寄宿生,有利于解决农村学生裁并校后的住宿、就餐和上下学问题。教室、实验室的空置率/利用率场景举例结合物联网,运用大数据技术分析后发现复旦大学新闻学院共计160个教研室的时间利用率/空间利用率仅有40%,而外语学院100个教研室使用率高达80%,场地非常紧张。因此,综合考虑,复旦大学可将新闻学院的部分教研室划分或借给外语学院使用,提高学校整体场地使用率,实现资源的再分配。学生体质健康达标率场景举例分析河南省教育部门采集的学生体质健康达标率后发现,初中学生体质健康达标率平均为60%。而对比体质健康达标率在80%以上的学校和达标率在60%以下的学校发现,同样是一周两节体育课的课表安排,大多达标率高的学校安排的是足球、篮球、羽毛球等运动量较大的体育项目,而达标率低的学校由于场地限制、经费限制等诸多因素,只能进行乒乓球、接力跑步、广播体操等体育项目。因此,来年可以据此向教育管理部门提出教育经费专项申请或变动体育课程项目安排,提高学生体质健康达标率。改革教学标准场景举例某二线城市小学二年级的教学标准中,制定者认为“run”这个词要达到语用标准,但根据实际收集到的数据是能够达到这个标准的学生不到20%,那么下一年,就可以做到这个词的标准只需要达到认知就可以了。教育机构教师场景举例教学资源精准投放:广西省某山村小学教师即将教到《少年闰土》,由于自身教学课件水平不高,希望找到一份适合广西省使用的教学课件,便于当地学生理解。登录某教育资源平台后,通过“广西”、“少年闰土”、“课件”、“图片丰富”等关键词搜索所需课件,再通过查看每个课件的课程标签快速找到所需资源。几次以后,平台通过大数据技术画出了这位教师的教学画像,并根据她的搜索间隔时间和六年级教学进度安排表预测她以后需要的教学内容,参照她以往选择课件的课程标签精准推送这位教师可能需要的教学资源,该教师登录平台后可立即收到平台的推送信息,做出选择。长此以往,随着该教师行为数据的增加,可以做到教师无需登录平台直接通过邮箱(或其他方式)收取平台通过大数据筛选后向她发送的教育资源。云题库智能组卷:广西省某教师即将要出一份期中考试考卷,希望在线上找到一些可供参考的题目。登录某教育资源平台云题库系统后,先选择六年级上学期数学题库,再选择上学期前三章内容,就能看到一些期中考试试卷可供选择。该教师选择了一份标签为“适中”的试卷后,点击选择题部分即可进入选择题题库根据考察知识点标签选择所需更换的题目,再依次挑选填空题、判断题、计算题、应用题等各类题型进行同样的操作。在选择过程中教师能清晰地看到已挑选题目的知识点标签数统计、难易题分数统计,根据统计情况进行适当的调整,最后选择部分题目更改数字后,即能生成一份合适的期中考试试卷。学生场景举例对小明进行行为数据跟踪,大数据分析后发现小明在英语课平均认真听讲时间仅有30min/45min,英语选择题错误率最高(30%),且以语法题为最(50%)。对小明做题过程进行数据收集分析后认为小明属于思维缓慢、思路明确型学生,因此综合来看,小明应加强做题速度,且加强语法学习,另外还可给出选择题做题技巧。某学生因计算失误平均造成数学扣分10分,而同年级学生平均因计算失误的扣分为18分,分析认为该学生的计算弱势并不明显,可将学习精力先放在其他弱势项上,平时对计算稍加注意即可。小红想报名三个月后的雅思考试,目标为6.5分,已通过英语六级考试500分。结合物联网采集数据和通话数据,运用大数据技术分析后认为小红每日可学习时间仅有4小时,即使再缩减其他事务,最多只能学习6小时,且分布于中午和晚上。根据大数据对雅思考生的观察,六级500分相当于雅思5.5分,同水平考生平均花费3个月每天8小时进行学习,最后雅思考试6.5分通过率为80%。因此不建议小红参加3个月后的考试,建议小红将学习时间延长到4个月,考试通过率较高。教学管理场景举例大数据发现李老师和赵老师同为物理老师,班级平均分均为77分。李老师教导风格属于“全民提升型”,擅长讲解基础知识和难度适中的题型,全班物理成绩在80-85分的人数占70%;而赵老师教导风格属于“优升劣降”型,擅长讲解提升型知识和难题偏题怪题,全班物理成绩在90分以上人数和60分以下人数基本相等,且优生和差生之和占全班人数的55%。基于这种情况,可考虑让李老师带差生班,赵老师带优生班,发挥二人的教学特长。结合物联网数据和家长反馈情况,发现广东省某初中班级学生完成课后作业时间平均为2小时,低于1小时的学生占20%,高于3小时的学生占10%。在低于1小时的学生中,差生占40%,可将此情况告知教师和家长,督促学生认真完成作业。在高于3小时的学生中,优生占70%,可基于3小时完成的作业量的不同重点关注做题效率较低的优生,由老师进行针对性辅导,找到低效原因,提高做题速度。另外还可结合物联网数据,对女生结伴上厕所的现象做统计,找到半年以来始终单独上厕所的女生,重点关注这类群体的心理健康,提前排查学生心理问题。教育服务商技术服务商场景举例平台技术服务商通过整合各处外部数据(百度搜索数据、教育机构学生数据、课程数据等),运用大数据技术分析后发现,用户最感兴趣的领域为语言培训(35%),语言培训中市场痛点为口语练习(60%),因此平台应主攻口语评测,结合用户希望在口语练习中实现的功能或效果(重要度排名)。此外,根据用户感兴趣领域排名和市场分析,制定平台功能实现步骤,做好顶层设计。语音识别技术服务商在建立语音数据库的过程中,利用大数据技术进行分类,将发音相似、意思相近的单词、句子进行归类,在听到用户的语音后,迅速将声波转化为模拟信号,再转化为结构化数据,快速在语音数据库中找到对应单词/句子,实现语音识别功能。平台服务商场景举例教育资源平台在全省甚至全国教育资源平台顶层设计的基础上,搭建湖南省长沙市教育资源共享平台,整合长沙市所有电子教学资源,并利用云存储技术上传到云端。师生即可通过互联网便捷地查看云端教学资源,打破以往各县各校的信息孤岛,实现资源共享。某校在电子教学资源上传时需要填写每份资源的基本信息,包括年级、学科等,上传成功后后台通过采集用户使用反馈,为各个教学资源贴上标签,如“适合优生”“不易理解”“中英文字幕”等,便于用户筛选合适的教学资源。教育资源精准推送可参考前文应用场景教育机构中关于教师的第一个场景。O2O平台吴女士希望为自己初二的女儿找到一位周末补习物理的教师,学生基础薄弱,希望先补习光、声部分。吴女士向O2O平台提交女儿学习需求后,后台结合地图出行数据后利用大数据技术迅速锁定了一位周六上午空闲的物理老师,该教师擅长补缺,具有7年教龄,且距离吴女士家里路程为步行30分钟。将这个匹配结果告知教师、家长双方后,两方都对这个结果非常满意,课程试讲后提升效果也不错。学习交流平台整合全国智慧校园的bbs平台,连接k12阶段的学生和大学在校生,通过平台交流的方式帮助学生在上大学前形成对未来所选专业的一个基本认识。随着平台覆盖范围以及提问问题的增长,可以利用大数据技术进行有效整理分析,规划出清晰的指导路线,比如针对一个对任何专业都不了解的学生,可以设计系统提问判断环节,引导学生选择一个专业方向继续深入了解。用户用户即学生和家长,由于家长是教育行业的主要付费者,因此我们分学生和家长两类应用场景做分析。家长虽不是教育行业的直接受众,但其担任付费者、监护者的身份,可以构建出不少大数据应用场景,如学校和学生家里教育内容同步管理分析、学生安全定位系统分析等。以保障学生安全为目的的实时了解学生动态系统,结合LBS技术,记录分析学生日常学习期间行动路径,实现分析异常状况及时推送到家长、学校端,解决教育行业安全问题。整合后的学生动态数据除了最直接的学生安全服务外,结合其他影响指标可以生成新的大数据应用场景(比如分析学生去图书馆、体育场次数停留时长等数据)。此外,家长和学生所处的社会环境不同,关注的话题自然也不同,如何让家长关注学生每天成长所处的环境更好的和学生交流,而不是只停留在考试排名这样的话题上,对学生成长也很重要。利用大数据挖掘学生关注的话题,推送给家长,并给出相应的建议。比如:最近出了一款新的卡通人物书包在小学生中很受欢迎,家长在接受类似信息后可以买孩子的生日礼物;某学校组织了中学生足球联赛,家长可以关心一下孩子在运动方面的成果。如果可以收集到每天,甚至每个班级的话题,这对于构建学生学习分析平台也具有重要参考意义。以构建基础硬件层为底层支撑,利用云计算、大数据的数据集成、数据安全、服务器集群、数据计算与挖掘分析等技术,遵循“18”(1个中心平台8大技术标准)大数据标准体系,通过HIVE和HBASE构建大数据数据中心。在此基础上,公司自主研发了“国子数据魔方”业务开发平台,通过业务开发平台进行应用开发、应用发布、服务注册的信息化管理,并可以将应用以可视化界面展示给用户,为领导决策提供数据依据。智慧校园大数据架构基础硬件层基础硬件层是由一组低廉的PC或服务器组合构建而成。基础硬件层主要承载着数据的存储、运算、容错、调度和通信等任务,对基础应用层下达的指令进行执行和反馈。数据集成大数据特征表现在实时、交互、海量等方面,并且以半结构化、非结构化数据为主,价值密度低,为了更好地“让数据说话”,并充分发挥大数据价值效应,应坚持“能采尽采”的原则,数据源的涵盖范围要尽量大。数据计算与分析挖掘大数据平台涵盖了大数据场景下常用的计算场景,包含离线计算、实时计算、流式计算、数据挖掘与机器学习等。可以更容易、更方便地构建全生命周期的数据湖,使数据的加工、处理、创新过程更加丰富,从而实现数据的更大价值。数据安全大数据平台通过一系列的认证授权和资源隔离机制,实现数据资源的安全性、可维护性、可用性、可信性。提供统一认证服务负责对使用者的身份进行验证;提供统一授权服务负责对用户的资源访问权限进行控制;提供统一资源调度负责对用户使用的底层资源进行隔离。服务器集群服务器集群是将很多服务器集中起来一起进行同一种服务,集群可以获得更高的计算速度,也可以用作备份,任何一个服务器损坏整个系统都能正常运行。群集化操作可以减少单点故障数量,实现群集化资源的高可用性。大数据技术标准一个中心平台:大数据业务开发平台。8大技术标准:基础标准、数据表示标准、数据处理标准、数据存储标准、数据服务标准、数据安全和隐私标准、行业大数据标准、大数据产品测试标准。大数据数据中心通过对各种类型的结构化、半结构化、非结构化数据信息的采集、预处理、分析处理以及存储等相关操作,构建统一、规范、全面的大数据数据中心,为相关工作提供数据支持。大数据业务开发平台以Hadoop为核心,融合优秀技术,提供开放的数据和业务开发平台,进行应用开发、应用发布、应用注册及应用服务的信息化流程管理,从而提升了大数据应用体验,有利于发挥创新精神,创造无限价值。大数据业务可视化分析大数据业务可视化分析能够将隐藏于海量数据中的信息和知识挖掘出来,为用户提供可视化的操作分析界面;为用户的相关活动提供数据依据,从而提高工作效率。智慧校园大数据平台标准体系大数据信息标准为数据收集、数据处理、数据存储、数据分析与挖掘提供指导和参照标准,加快建立智慧校园信息采集、存储、公开、共享、使用、质量保障和安全管理等技术标准,引导建立信息共享交换的标准规范,促进信息资源开发利用,实现大数据汇聚整合,为大数据、云计算提供强有力的基础支撑。抓好大数据标准体系建设,推进国家大数据战略实施,应对三方面需求:面向智慧校园教育的需要,研制开放、共享大数据标准;助力智慧校园教育创新发展,制订典型领域相关标准;保障资源安全、保护个人隐私,研制安全标准等,以数据为基本元素进行数据安全管理,规范数据的共享、使用和管理的整个流程,解决跨平台的数据交互、数据开放共享等难题。公司对我国现有标准、在研标准和将提出的标准计划进行梳理,依据大数据技术体系,从基础、技术、产品、应用等不同角度进行分析,形成了大数据标准体系框架,按照"18"的理念进行设计,即以"国子数据魔方"业务开发平台为支撑,构建基础标准、数据表示标准、数据处理标准、数据存储标准、大数据服务标准、大数据安全和隐私标准、行业大数据应用标准和大数据产品测试八大技术标准。通过平台和技术标准的建设,整合和引导资源、激活科技要素、推动自主创新与开放创新,促进大数据健康发展;加速技术积累、科技进步、创新成果推广,加速大数据在智慧校园的广泛应用,促进智慧校园全面、协调、可持续发展;解决数据共享难、数据格式不统一、数据标准不规范、数据重复建设等难题。基础标准大数据术语、大数据参考架构、大数据平台架构标准,能够更加切合实际的对相关操作进行描述,形成统一数据标准,进而为数据库提供基础支撑和服务。数据表示标准数据编码规范、元数据规范、非结构化数据、数据集统一描述规范等,确保数据信息的交互共享,进而消除信息孤岛。数据处理标准数据质量评价标准、数据采集标准、数据组织标准等大数据处理阶段相关的标准规范,消除变量自身变异和数值大小的影响,为大数据应用打下良好的基础。数据存储标准非关系型数据库规范、非结构化数据管理系统规范等大数据背景下的新型存储系统相关规范,有助于数据进行交互式传输和管理,提高存储量、存储速度,进而为大数据快速挖掘、提取、分析提供基础。大数据服务标准提供大数据实时分析服务、可视化服务等一系列大数据服务的标准化描述和接入,提升数据之间的关联性,降低数据分析的复杂度,大幅度提高分析的准确性。大数据安全和隐私标准大数据对外服务时,制定数据存储安全、数据传输安全、数据分析挖掘安全等方面的标准,为安全面临的内部管理和外部攻击提供可靠的数据存储、安全的挖掘分析、严格的运营监管。行业大数据应用标准相关领域大数据应用、领域大数据的分类和编码等方面的标准,能够更准确地规范各行业的数据标准,并推出与行业相匹配的产品。大数据产品测试标准大数据产品的测试场景、测试指标、测试工具等。大数据产品测试标准的建立能够公平、客观地评测大数据产品的功能和性能,对人们选择合适的大数据产品具有重要的参考价值。智慧校园大数据业务开发平台为提供众多便捷易用的开发框架和服务引擎,使用户可以迅速地掌握、认知以及使用平台上开放的数据,针对不同的应用场景选择合适的服务引擎进行二次开发,公司自主研发“国子数据魔方”业务开发平台,在提供开放数据的同时,也允许用户通过该平台进行大数据应用的开发,为用户提供一体化应用开发、测试、部署、运行、管理、监控等托管环境,使应用开发人员无需关心应用的底层硬件和基础设施建设,从而提高工作效率。智慧校园大数据业务开发平台架构图大数据数据中心大数据数据中心不是简单的硬件设备集成,也不仅仅是数据存储的中心,而是数据流通和应用服务的中心。它具备十分丰富的信息资源、安全可靠的机房设施、高水平的网络管理和十分完备的增值服务,数据中心是智慧校园信息化建设的基础性项目之一。数据中心通过统一的数据格式实现应用系统之间的数据交换和共享。智慧校园数据中心具有以下建设意义:1.收集、存储各类数据的同时有效地将数据管理起来,打破“信息孤岛”的存在,为智慧校园各个应用系统提供统一的数据服务,保证数据的一致性。2.为学校部门和各位领导提供实时数据。各部门之间可以很方便地查看其他部门的公开数据;领导可以统筹查看全校所有部门的业务数据,能够直观地了解学校的情况。3.便于后期的应用系统开发,将应用与数据分离开来,降低应用系统扩展开发的难度,为全面整合智慧校园应用系统打下坚实的基础。大数据业务平台层大数据业务平台由组件、大数据处理引擎、APP、BI引擎构建而成。大数据业务平台是基于PAAS思想构建,并遵循SAAS标准。组件组件是大数据业务平台的最基本元素,在大数据业务平台中内建组件接口标准,所有的组件都遵循该标准。在标准中定义组件的输入、私有项和输出。在业务开发过程中,通过图形化界面对一个或多个组件进行创建、编辑和关联,从而组合成一个数据处理服务对外发布。大数据处理引擎大数据处理引擎是整个业务平台的执行中枢,通过对发布服务中的关联组件进行解析、调度、执行、迭代、合并等操作实现整个服务的平稳运行。APPAPP是由一个或多个发布的数据处理服务组合而成的轻应用。用户通过图形化界面编辑APP展现的数据和图表形式。BI引擎BI引擎对构建的APP的数据绑定服务和图表形式进行解析和展现。智慧校园大数据平台建设关键技术大数据平台的构建借鉴了开源系统的先进理念,采用了Hadoop开源系统,充分利用HDFS的可靠性,MapReduce的引入大大加强了平台在数据分析方面的弹性,使平台在可扩展性、可靠性、易用性和性能方面都有良好的表现。Hadoop技术Hadoop框架是一个开源的大规模数据处理平台和工具,主要来源于Google公司提出的MapReduce编程框架,GFS文件系统以及BigTable存储系统等技术。Hadoop具有庞大的家族体系,本平台的构建主要涉及到Hadoop框架的分布式文件系统HDFS和MapReduce模型。分布式文件系统作为Hadoop框架的底层,主要负责分析数据的分布式存储和管理,MapReduce模型主要是负责对大规模数据集进行计算处理。Hadoop釆用HDFS文件系统子框架来实现其所具有的存储能力,用MapReduce编程模型框架来实现其计算能力,二者的巧妙结合使得Hadoop拥有高效的存储和计算能力。HDFS技术HDFS分布式文件系统是对大规模数据实现分布式存储和管理的有效工具,也是分布式计算的存储基础,具有很高的容错性和扩展性,并且对数据读写提供了的高吞吐率。HDFS实现了数据的分布式存储,使得应用程序能够更加灵活地访问大规模的数据集,同时也为后续对大规模数据的分析提供了数据平台。HDFS分布式文件系统釆用的是典型的主/从结构,这种结构极大的简化了系统的架构,使得系统更加简洁,方便系统的管理。Hadoop的分布式文件系统HDFS主要由主控制器和数据节点组成,主控制器管理名字空间和数据节点,同时管理数据块到数据节点DataNode的映射等。文件系统中的DataNode作为数据节点,主要存储实际的数据,主要负责所在的物理结点上的存储管理,执行主控制器下达的命令。数据节点能够及时接收客户发送的读写请求,并针对这些请求完成相应的操作。从分布式文件系统的结构内部来看,数据文件被存储分割成多个数据块存储在每个数据节点上,每个数据节点存储着来自多个文件的数据块,同时每个数据节点上也会存储这些数据块的多份副本,保证后续数据操作的准确性。MapReduce技术MapReduce技术基于分布式文件系统,通过编写相应的处理过程能够实现对大规模数据集进行并行计算和处理,通过对不同分析模块编写相关的MapReduce处理函数能够实现对大规模数据的精确分析,同时能够控制各个节点之间完成高效的任务调度。MapReduce通过将操作分发给网络上的各个节点,每个节点会周期性的返回它所完成的工作和最新的状态,从而实现对大规模数据集的操作,这种处理方式保证了操作的可靠性。MapReduce技术处理的方式是,首先将一个具体的任务分解成为若干个很小的任务,然后将分解后的任务分配到各个分节点,通过主节点来对分节点的任务进行管理和调度,然后得到分节点处理后的结果,再将结果整合,得到最终结果,通过多个节点之间的相互合作和调度,从而实现对大规模数据集的计算和处理。总的说来,MapReduce就是基于“分而治之”的思想实现“任务的分解与结果的汇总”。智慧校园大数据平台建设效果构建高院校大数据分析平台是以智慧校园战略发展规划为蓝本,以智慧校园信息化建设纲要为依据而进行的创新性探索。以大数据建设顶层设计为基础,收集整合智慧校园教育各方面所产生数据,从数据中提取出有价值的信息和模型,推动智慧校园教育的全面创新。开展大数据顶层设计,以大数据应用全面推进学校发展大数据将成为推进学校发展的新动力,通过开展大数据顶层设计,对大数据获取、收集、整理、利用进行全面规划,从应用需求出发,明确建设目的和路径,明确什么要做,什么不要做,什么应该先做,什么应该后做,用什么模式做,做到什么程度,达到什么效果,以指导学校未来3-5年的大数据建设。快速推进教学和管理工作的信息化,建立丰富的数据来源用大数据方法全面分析现有教学和管理工作,新建或升级信息系统,对教学和管理实现全过程记录,建立丰富的数据收集渠道。如通过对现有远程教育系统进行全面升级,跳出远程教育的概念,实现对教学过程的全面支持,详细记录每个学生的学习行为数据,包括课程学习数据、视频观看数据、资料查阅数据、作业完成数据、互动交流数据、成绩数据等,将数据细分到每个行为细节,以提供超越传统系统的数据精细度,客观地反映出学习的实际状况。通过建立物联网应用,实现对物品、人员、安全等各方面管理的强大支撑,提升管理质量的同时积累大量管理数据和行为数据。基于个性化服务需求,建立大数据分析模型提供优秀的个性化服务是教育和管理的重要目标之一,大数据应用则是提供规模个性化服务的必要条件,而大数据分析模型的质量决定了数据的价值。一个平时被忽略的数据在好的模型中,会产生难以想象的作用。我们可以通过对学习行为数据的分析,了解学生的学习兴趣和学习效果,研究哪些学习方式是最容易被接受的,哪些课程的设计是最受欢迎的,或具体到某个作业问题回答的正确率以及横向和纵向的比较,并深层次的展现出其中的原因。这些数据被提供给教师,将对教学创新提供最为直接的支撑。通过对一卡通行为数据的分析,可以了解学生的日常行为规律和消费规律,了解学生行为与学习成绩、学校效果之间的关联关系,提供学生管理创新的依据。综合应用大数据成果,推动学校全面创新通过大数据的综合应用,可以建立对各项教育和管理工作的分析和判断,应用到实际工作中,从各个方面推动学校全面创新。通过对教学过程、学习行为、学习成绩、教学满意度、教师需求量、专业师资质量、专业成熟度、行动轨迹等综合分析,建立教师画像、学生画像、专业画像,直观了解优势和不足,预测发展状况。通过对学生人数、宿舍分配、教室使用、能源消耗、网络消耗、食堂消费、图书馆利用等进行综合分析,建立各资源利用率指数,实现数据可视化,引导管理工作的精细化和管理的扁平化。通过对一卡通、图书借阅、专业分布、课程分布、成绩、学习行为等进行聚类分析,发现具有某些特征的特殊群体及其独有的行为方式,并利用相关性数据进行挖掘,从中发现规律。通过对教学数据、教学效果、考勤记录、个人数据、管理数据进行综合分析,建立科学的、真实客观的教师绩效评价体系,改变传统人为评价的主观性,让大数据选出真正优秀的教师。智慧校园大数据常见业务系统以下是智慧校园常见的业务系统。这是某个智慧校园业务系统的数据流情况,我们可以发现业务系统和数据中心并未完全数据交互共享,因此我们在规划建设智慧校园大数据时需要协调各个职能部门的资源确认业务系统的数据接口。同时由于各个业务系统之间数据不统一,我们在采集数据过程中还需进行数据转换,转换成我们所需的数据格式,这些都带来大量的工作量。学校业务系统的数据类型和属性很多,有数百种。我们进行数据的归纳和整理后也涉及40多种数据。比如:正方教务系统主要包括学生基本信息(籍贯、生源地等)、学业信息(已完成学分、未完成学分)、课程信息(学生已修课程、学期课程表等)、成绩信息等。智慧校园大数据服务用户类型智慧校园中对大数据有具体需求的部门,以及对大数据应用的具体需求内容,在智慧校园大数据建设中需要相关的对应分析。校领导1、师生整体情况2、学校舆情3、科研水平4、资产情况院领导1、学院各专业各班级的集体/个人行为画像2、学院教师的课程和科研情况校工会1、评判贫困生、奖助学金结果的合理性,识别冒领人员2、教职工的劳资情况设备处1、现有资产现状2、资产发展趋势3、各品牌资产的故障率4、各单位资产采购规划图书馆1、图书馆藏现状2、图书借阅现状3、趋势分析4、图书采购规划校医院1、药品收支率2、学校健康档案3、传染病预防和治疗4、分析药品副作用老师1、班级成绩2、班级/个人行为画像3、图书借阅,推送书籍4、科研情况学生1、成绩和能力情况2、就业市场和招聘指导3、图书借阅4、消费、网络企业根据学生行为画像情况和企业岗位要求匹配度,推荐学生到企业实习或就业。智慧校园大数据平台能够为高教提供一体化的大数据产品与服务,实现端到端落地。在数据源方面,智慧校园大数据平台可以实现对学校业务系统、一卡通系统、上网行为系统、各硬件设备、校内校外各大网站论坛等的数据源获得,对于数据接口不标准或者不开发的场合也能进行针对性的办法。数据采集方面可以使用智慧校园大数据平台ETL采集工具箱和通用的采集技术为学校提供采集服务,并且根据学校业务情况和大数据需求进行针性对性数据清洗与建模工作,并为学校制定完善的数据规范标准体系。同时还能整合各类分步式数数据库、sql数据库、oralce数据库等,建设学校统一的数据仓库,并提供统一的接口给各类大数据应用服务。智慧校园大数据平台还会为客户提供一套大数据的管理平台,用于对各个环节的有效监控与管理,包括数据状态、数据质量和准确性等,便于学校日常的运维与管理。大数据业务应用基于Hadoop生态集群,将数字化校园相关的人、财、物、网络等结构化、半结构化和非结构化数据,利用HDFS、Mapreduce进行分布式文件存储及计算,采用关联规则分析、聚类分析、相关分析等分析方法,以各种可视化图形的方式,将结果展示给用户,为领导决策提供数据支撑。大数据业务应用包括教学创新的应用、科研创新的应用、管理创新的应用以及其他方面的创新应用。大数据教学创新应用教学质量评估对学生给予教师的评价、学生活跃程度、学生成绩和教师授课情况等数据进行分析研究,帮助教师更好地进行教学活动。上网行为对各年级同学上线次数、上网时间段、总流量以及在线课程的欢迎程度等数据进行分析研究,引导学生合理运用网络资源,树立健康的上网理念。学生成绩分析对学生成绩以及排名等数据进行分析研究,更加清晰地了解学生成绩的整体分布状况以及学生的学习状况。

大数据科研创新应用科研成果对科研成果的获奖比例、科研成果的学科背景和科研成果的论文级别等数据进行分析研究,清晰统计科研获奖情况。科研项目对科研项目的负责人年龄、学历、以及院系等智慧校园科研项目信息进行分析研究,更全面地了解学校科研项目情况。科研经费对科研经费的投入、科研论著的发表数量以及各学院经费的投入和支出等数据进行分析研究,直观地了解科研经费、科研成果以及科研奖励等方面的信息。

大数据管理创新应用招生分析对学生的生源地以及招生的学生类型等数据进行分析研究,发现哪几个地区的考生是历年招生的主力军,进而为学校做到有重点、有突出、有成果的招生指导。就业分析对学生就业的地区分布、就业行业以及就业专业排名等数据进行分析研究,为智慧校园决策者提供指导或数据支持,改进现有的教育模式,提高对毕业生就业指导的实效性。住宿分析对学生住宿过程产生的数据进行分析研究,帮助学校相关管理人员更加合理地分配宿舍资源,更加科学地进行宿舍管理。资产数据统计分析对资产的数量、资产的分类以及资产的年增长率等数据进行分析研究,为各类资产的购置和合理分配提供了决策支持,便于校领导从全局上把握资产信息,加强成本核算,对固定资产进行系统的规划、建设和管理。

大数据创新应用学生轨迹分析对学生各学年的成绩、餐厅消费、购物、进出图书馆的次数、借阅图书以及吃早餐的次数等数据进行分析研究,利用这些数据,不仅能预测出学生的学习状况,而且学校还可以依此引导他们更好地规划各自的学业和就业方向。

学生画像对学生在校生活和学习状况等数据进行分析研究,掌握学生的目标动向,无论是学习还是参与社会活动,都能够有的放矢地帮助学生做进一步规划。智慧校园大数据建设模块学校概况模块智慧校园大数据平台的“学校概况”模块,主要给学校和院系领导使用,能够从宏观、全局把控学校教学、管理、科研、资产等各个方面的整体情况,可以预测学校的发展趋势并且给出决策建议。比如在消费方面,校领导可以看到近一个月的消费金额和地点的情况,也可以看到昨日全校消费综合、平均消费人次和平均消费额,可以看出学校整体消费水平的发展趋势;或者通过关联分析,知道哪些省份的学生成绩最好,哪些学院的学生自律性最强等。全校一卡通消费情况学生生源分布地图教师职称统计图各学院学历分布图全校学历分布情况全校成绩统计图全校/各院学生综合分析各院逃课率占比全校上网信息学校舆情情况各省成绩分布图综合预警平台我的大学模块学校最大的用户群体是学生,在微信层面开发了“我的大学”这个功能模块,为每个学生提供了一个平台,从成绩、图书、消费、网络、就业多维度展现学生的大学情况,可以让学生、老师和家长全面角度审视和了解自己。比如我的成绩,学生可以知道自己的成绩情况、历史走势、在学校的分步与排名等内容;我的课程统计了学生课程名称、授课老师、课程介绍及关键知识点;我的读书记录了图书明细、图书内容简要介绍、借阅记录等资料。我们还可以根据学校的需求,将学生的近况推送给家长,便于家长及时掌握孩子的情况。学生成绩详情分析学生图书借阅分析学生详细当前借阅信息学生课程表我的消费学生可以详细知道自己的消费金额、消费内容、消费时间、个人消费比例和排序等。比如某学生可以知道每天分别在什么时间、在什么地方各自花了多少钱,以及消费报表与数据分析,可规范学生的消费。在学校层面,学校也可以通过消费信息的数据,来评判学生是否是真正的贫困生,在助学贷款或者学校助学金放发时起到客观的参考作用。我的网络学生可以了解自己的上网时长、个人上网网站频率比例和排序。该数据也可以同步给学校老师比如某个学生长期在晚上深夜有上网行为,或者在正常上课期间大量的上网,平台会有预警信息推送给该生;同时老师可以提前进行进行相关的疏导与教育。行为画像模块通过对学生课程、生活等数据挖掘分析,我们可以得知学生成绩、消费、借阅各个方面的得分。我们也借鉴了QQ形象标签这功能,为学生贴上学渣、学霸、上网达人等标签。辅导员也根据学生的特点标签,为每个学生情况进行指引教育工作。为整个学生大学四年的所有学习、生活、上网、消费等所有数据,通过大学生涯的跟踪和分析,为对每个学生勾画个人形象。这些数据还可在毕业时形成客观真实的行为画像报告和评价。学生应聘面试的时候可打印本报告,向面试官展现自己大学四年的整体情况,也便于企业了解每位学生挑选适合岗位的人才;另外也让学生更全面地知道自身优势,选择对自己有利的企业和岗位。同时,我们可以根据每个学生的报告,结合企业招聘要求,向企业、学生推送人才、招聘信息。综合预警模块根据前面提到的学校概况、我的大学、行为画像三大功能模块,我们可以实时了解各学生在学校的行为和学校的发展现状,在出现特殊情况时及时报警,提升学校管理的及时性与风险预判定位的能力。比如学生在某一天突然在食堂出现了5000以上大额消费,或者低频率的小额消费。(事实上部分学校的一卡通系统默认设置每天限额,一般不会出现一天在饭堂刷卡5000元的)前者意味着要么被盗刷,要么学生过份铺张浪沸。此时平台可以及时报警,通过微信、邮件等方式推送给该学生的辅导员。后者则证明该学生有可能生活困难,也可及时报警通知辅导员关心该生的生活情况,必要时可申请生活资助。本平台可以采集到学生网络、消费、图书借阅等信息,通过对这些数据关联分析,我们可以实现学生的失联预警,避免意外发生;学生上网沉迷预警,及时向学生进行辅导教育,避免学生误入歧途;图书借阅预警,避免因图书过期产生费用。舆情分析模块通过爬虫软件和其它的采集系统,对校内的论坛、校外的知名网站进行关键字信息收集与舆论分析,可按照关键词的紧急程度划分紧急、重要、一般三个等级,根据学校的需求按照时间影响程度不同采取不同的推送措施。比如在校外知名论坛上,突然出现了对本学校大量的负面舆论,很有可能有人恶意造谣,对学校会带来很不好的影响。因此可第一时间报告给学校管理员,及时进行的舆论导向工作与解释工作,并追踪恶意造谣的人员。对校内的监控中,比如出现了如自杀、重度抑郁等高危和敏感词时,也可及时发展并通知管理员进行核实与安抚工作。通过对学校内部的论坛、社会上的常用互联网平台的监控,实时了解学校舆论的关注热点词,以及社会上对学校的舆论动态,并实时反馈给学校管理者和校领导,使学校做出及时的舆论导向工作。招生就业模块我们利用大数据分析可以得到每个专业发展情况,比如国家及区域的产业政策,历史毕业生就业分步,岗位、对口率、薪酬等,以及清晰当前企业人才需求情况,动态调整课程体系和教学内容。在学校层面,可以利用大数据分析了国内外等标杆院校相同专业的情况,包括招生就业、师资、实训、校企合作等,找出自身的优势和不足,形成一种合理专业的评价量化指标体系。在学生层面,可以知道本专业的就业前景、就业方向,可以更好地规划大学的课程和专业技能的锻炼;平台可推送招聘信息(前面有提及)在辅导员层面,可以根据本专业就业情况、本专业学生画像和每个学生的个人画像,开展更符合专业情况、学生总体需求的专业指导课程,也可以根据每个学生的实际情况提供个性化的就业辅导。通过对就业情况的深度挖掘,我们还可以学生专业历史上多年的毕业生在社会上的年龄分布、学历分布、薪资分布、地域流向等信息,可以更好为校企合作、学生应聘、就业辅导等提供服务。数据安全模块智慧校园大数据安全分析平台,针对智慧校园内部信息化设备数据进行采集和存储(如网络设备、安全设备、主机、应用系统),获取到网络日志、身份认证信息、人事等信息数据,使用大数据与机器学习等技术进行安全分析,可以根据时间维度展现网络安全的全局动态,显示安全报警计数和内容,从而发现隐藏的威胁,快速定位故障区域和故障设备,主动应对安全风险。通过仪表盘,可以排查非法外联、介入移动介质、病毒木马、操作系统漏洞等风险(包括虚拟化环境下的风险),并且可以根据按照部门、安全事件类型、设备、人员等视角提供安全分析报告,从而得知安全风险最高的部门和设备及相应的风险类型,管理分析后可快速定位故障原因并优化网络,减少安全风险。智慧校园大数据云平台及应用系统技术云平台技术介绍过去几十年里,数据中心技术发生了天翻地覆的变化,2000年前后的互联网发展推动了数据中心从大型机时代转向独立服务器和集中存储架构。相比之下,独立服务器带来了比大型机更加灵活的系统的环境;可以通过网络访问让也降低了运维的复杂性。业务部门需要盈利,数据是关键因素。依赖于其灵活的容量调配和高可用设计,集中存储实现了可共享的、更大的存储资源池,并且可以提供数据的保护能力。池化让存储资源得到更充分的利用,RAID及基于存储的容灾复制技术使得数据得到充分保护,避免因为服务器宕机、管理员误操作等引起数据丢失。但是独立服务器和共享存储架构也存在很多问题,独立服务器带来的是竖井式的架构设计,相应的服务器资源利用效率不平均,总体来说利用率非常低下(平均5-10%)。另外服务器也经常成为单点故障。集中存储的系统复杂性也需要额外的管理工具和技术团队来运维,专用的存储系统也让用户很容易被锁定。虚拟化技术的出现使得多种工作负载和操作系统以虚拟机VM)的形式运行在单一物理机上,大大增加了物理服务器的资源利用率。随着Vmware等厂商的推动,X86虚拟化方案的功能日渐丰富,率也大幅提高。借助诸多高级功能,比如在线迁移、高可用和动态资源负载均衡等,用户真正获得了虚拟机的高可用能力,并且可以动态迁移和管理工作负载。集中存储虽然通过合并路径等操作来提高效率,但大规模虚拟化集群中虚拟机的快速增长却会带来下面的问题:虚拟机快速增长导致更多的存储,代理更加复杂的管理;多个虚拟机征用带来的资源冲突;存储的控制器架构带来的性能瓶颈;做为一种日益普通的存储介质,固态硬盘的出现在一定程度上解决了集中存储的问题。放在集中存储中的固态硬盘使得无需借助更多的阵列就可以提供更高的IO性能和更低的相应延迟。但来自集中存储控制器和网络的瓶颈依然存储,应用的竖井架构和复杂的存储管理依然存储。在计算、网络和存储三层架构的传统数据中心中,随着服务器CPU处理能力的日益提升,网络日益成为瓶颈。传统的4/8/16GBFC网络带宽只能对应1到9块固态硬盘的I/O处理能力。另外,电商、大数据等诸多应用对实时系统要求日益提高,相应延迟成为一个影响客户体验的问题。一个典型的网络响应时间为0.5毫秒,而本地内存访问的延迟不到1/100。很多基于服务器的缓存技术出现,正式为了缓解网络延迟问题。云计算和互联网的蓬勃发展,带来用户对不可预见的IT资源需求。互联网架构就是面向业务快速增长的敏捷IT需求而设计,是一种面向基础架构和计算资源的全新计算架构方式,可以实现互联网规模的弹性架构能力。但是数据中心不会走向Google、阿里这样的大规模,而且有其他在高可用等方面的特定需求。目前很多流行的融合架构、软件定义的智能化、分布式系统、基于API的自动化等概念,正是在互联网架构下衍生出来的企业级IT技术趋势。相对于传统的计算、网络和存储的三层数据中心架构,融合架构可以将多个组件组合在一个单元中,提供计算、网络和存储服务,并且可以独立扩展,这样消除传统计算和存储的竖井架构。当然,很多环境下客户也需要存储和计算分开维护,融合架构要提供这样的灵活性,并且能利用到本地I/O处理带来的快速响应。软件定义是指运行在通用的商品化硬件之上,通过软件来实现核心的逻辑,把关键处理逻辑从专用硬件中剥离。软件定义可以降低对硬件的依赖,提升系统的敏捷性和健壮性,具备如下特征:底层负责提供服务,采用X86等通用硬件;控制平面和数据平面分离,并对底层资源进行抽象;可以通过可编程的接口实现高度的自动化;分布式、可线性扩展的系统,是指从之前的单一集中模式处理业务,转向集群内所有节点分布式处理业务,并且可以在需要横向扩展时随时扩展系统的性能和容量。传统架构设计的前提是假定硬件可靠,至少在某种程度上是可靠的,正如服务器、存储等某个单点上是5个9高可用一样。但分布式系统的假定是硬件终究是会出问题,关键点是如何在一个简单的、以业务不中断的方式来处理故障。分布式系统的设计是为了调整和修复故障,并且能做到自恢复。任何一个故障出现,系统会通知管理员,而修复都可以按照管理员之前设定的流程自动化的去修复。这样就解决了单点故障,消除了系统中的瓶颈。灵活的线性扩展使得系统的计算、网络和存储容量可随时灵活扩展,客户可以从小规模开始,在任何规模都能获得一致性的性能和容量增长。总结以上数据中心的技术变迁,虚拟化技术的出现解决了计算资源的利用率的问题,但存储的负载和复杂性依然存在,同时网络层面的开销和延迟也降低了客户体验。固态硬盘、服务器本地缓存等技术的出现和完善,使得分布式系统成为可能,软件定义降低了对专有硬件的依赖,通过软件的方式来实现分布式系统的自恢复和管理,互联网架构在企业级数据中心中成为可能。公共云技术云技术(Cloudtechnology)基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着物联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。公有云通常指第三方提供商为用户提供的能够使用的云,公有云一般可通过Internet使用,可能是免费或成本低廉的。这种云有许多实例,可在当今整个开放的公有网络中提供服务。外部用户通过互联网访问服务,并不拥有云计算资源。其意义在于能够以低廉的价格,提供有吸引力的服务给最终用户,创造新的业务价值,公有云作为一个支撑平台,还能够整合上游的服务(如增值业务,广告)提供者和下游最终用户,打造新的价值链和生态系统。虽然每个公有云的提供商都对外宣称,其服务在各方面都是非常安全,特别是对数据的管理。但是对教育行业而言,特别是区域级教育系统而言,和业务有关的数据是生命线,是不能受到任何形式的威胁。所以短期而言,区域级教育用户不会将其核心业务应用放到公有云上运行。区域教育云技术区域云或者私有云是为一个客户单独使用而构建的,因而提供对数据、安全性和服务质量的最有效控制。用户方拥有基础设施,并可以控制在此基础设施上部署应用程序的方式。私有云可部署在云数据中心的防火墙内,也可以将它们部署在一个安全的主机托管场所。私有云可由用户自己的IT机构,也可由云提供商进行构建。在此托管式专用模式中,云计算提供商可以安装、配置和运营基础设施,以支持一个企业级数据中心内的专用云。此模式赋予用户对于云资源使用情况的极高水平的控制能力,同时带来建立并运作该环境所需的专门知识。私有云在安全方面是非常有优势的,因为它一般都构筑在用户防火墙后。私有云是大用户或者个人自己拥有的云服务器,并且服务器不对外开放,仅供自己内部使用,这从某种意义上来说降低了泄密的风险,比公有云更安全。虚拟化技术虚拟化是指计算机元件在虚拟的基础上而不是真实的基础上运行。虚拟化技术可以扩大硬件的容量,简化软件的重新配置过程。CPU的虚拟化技术可以单CPU模拟多CPU并行,允许一个平台同时运行多个操作系统,并且应用程序都可以在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。虚拟化的主要目的是对IT基础设施进行简化。它可以简化对资源以及对资源管理的访问。虚拟化的优势1.整合服务器,提高资源利用率通过整合服务器将共用的基础架构资源聚合到池中,打破原有的“一台服务器一个应用程序”模式。2.降低成本,节能减排,构建绿色IT由于服务器及相关IT硬件更少,因此减少了占地空间,也减少了电力和散热需求。管理工具更加出色,可帮助提高服务器/管理员比率,因此所需人员数量也将随之减少。3.资源池化,提升IT灵活性4.统一管理,提升系统管理效率5.完善业务的连续性保障虚拟化实现软件方案客户操作系统很多情况下是通过虚拟机监视器(VirtualMachineMonitor,VMM)来与硬件进行通信,由VMM来决定其对系统上所有虚拟机的访问。在纯软件虚拟化解决方案中,VMM在软件套件中的位置是传统意义上操作系统所处的位置,而操作系统的位置是传统意义上应用程序所处的位置。这一额外的通信层需要进行二进制转换,以通过提供到物理资源的接口,模拟硬件环境。这种转换必然会增加系统的复杂性。硬件方案CPU的虚拟化技术是一种硬件方案,支持虚拟技术的CPU带有特别优化过的指令集来控制虚拟过程,通过这些指令集,VMM会很容易提高性能,相比软件的虚拟实现方式会很大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论