版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1数据科学导论 刘苗 Nov.11, 2019 第一章 内容介绍2主要内容一 适用对象二 教学安排三 教学方法调整四 学习资源3一 适用对象4适用对象数据科学是问题驱动或数据驱动的科学. 本书适用于本科数据科学的入门课程. 目的: 介绍数据科学的基本思维和概念, 并通过案例来理解数据科学实践并初步掌握基本的软件工具.实际上, 任何知识和能力都应该基于自学. 自学的最好方法是拉动式学习, 即 应用或实践是学习的最大的动力和目标.切忌死记硬背, 要通过实践来熟悉.5二 教学安排内容设置原则本书的内容选取的原则是:1. 注重知识主体、强调最基本的思想, 舍弃缺乏普遍性的结论.2. 任何方法的使用都通
2、过案例来说明, 不介绍空洞的抽象概念.3. 强调数据本身的主导作用, 尽量避免被主观假定驱动的结论或论述.4. 尽可能地回避用数学细节作为论述的主要工具.6教学安排本书的内容安排基本上按照数据科学的步骤及思维, 所有讨论都基于实际数据案例并通过R 及Python 软件实现. 1. 提出问题、收集并整理数据是数据分析的起点; 数据预处理数据预处理2. 然后则是探索性分析; 描述统计描述统计3. 核心是介绍各种机器学习模型以及模型的验证和选择. 推断统计推断统计78教学内容第一部分:本书的安排及软件介绍(chap1-2) R和Python为领悟而运行 第二部分:数据及探索性数据分析(chap3-4
3、) 数据的形式、获得及简单描述;如何整理和清洗数据第三部分:有监督学习(chap5-13) 本书最重要的一部分, 有监督学习是人工智能的基础. 第四部分:有监督学习(chap14-15) 主成分分析和聚类分析第五部分:网络爬虫(chap16)9有监督学习第五章有监督学习概论第六章最小二乘线性回归第七章Logistic 回归第八章决策树树及其组合方法第九章支持向量机第十章人工神经网络第十一章朴素贝叶斯第十二章K 最近邻方法第十三章有监督学习模型比较案例及习题10三 教学内容调整根据需要和疑问调整教学内容 拉动式学习方法 从实际问题出发,从数据出发解决问题. 根据学生的需要教学 教学顺序和教学内容均可以调整. 老师应该让学生产生疑问 使得学生增加好奇心和更多疑问的课堂教学是成功的.1112四 学习资源13充分利用网络资源R主页: R Graphical Manual http:/bm2.genes.nig.ac.jp/RGM2/index.php统计之都: /QuikR http:/ R语言中文论坛 http:/rbbs.biosino.o
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《劳动用工协议》
- 西餐厅顾客投诉处理制度
- XXXX学校2021年课外活动工作总结
- 物流配送效率提升方案
- 幼儿园教研组长工作总结与家园合作
- 商务接送车辆租赁协议书
- 餐饮业共享盘供应链管理方案
- 2024-2025学年河北省邢台市质检联盟高三上学期第一次月考物理试题及答案
- 金融行业监控室风险预警方案
- 建筑项目结算审核服务方案
- (正式版)JTT 1499-2024 公路水运工程临时用电技术规程
- 电大财务大数据分析编程作业3
- 儿童通信知识科普
- 2024年高考体育单招考试政治重点知识点归纳总结(复习必背)
- 内蒙古呼和浩特市回民区2023-2024学年九年级上学期期中考试历史试题(含答案)
- 校园文化知识讲座
- 开展法律宣传知识讲座
- 连锁经营与管理职业生涯规划书
- 傅青主女科之带下病
- 2024年八年级语文上册期末专项复习:病句的辨识与修改
- 法院服务外包电子卷宗随案生成扫描服务方案
评论
0/150
提交评论