版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、从Python基础到数据清洗,到爬虫,到案例分析实战,还有Python量化与统计计量,all about Python:等级课程时间方式Level1Python编程基础入门,从配置环境到能够上手5月6-9日四天北京/远程Level2Python数据清洗及统计描述数据思维和数据清洗5月13-15日三天北京/远程Level3Python爬虫学会网络爬虫收集数据5月20-21日两天北京/远程Level4Python数据挖掘,算法及案例5月27-30日四天北京/远程专题Python量化投资基础+实战4月15-16,22-23日北京/远程专题Python统计计量4月28-5月1日上海/视频(课程详情请参
2、照回复)Level1-Python编程基础 5月6-9日四天 北京/远程 3200/2600课程大纲:一,Python概述 (0.5天)注: 本部分课程主要为Python语言的介绍及基础环境的安装配置。0.1Python语言介绍、Anaconda科学计算集成介绍安装0.2Python编译器、Shell、编辑器介绍0.3Python的第三方包的管理0.4Python在数据分析领域的生态介绍二,Python编程基础 (3.5天)注: 本部分主要为讲解Python的基础编程知识,侧重于Python数据分析常用的功能和知识点进行讲解。课程安排:1.1Python语言特点1.2Python的数据类型和变
3、量1.3Python中的运算1.4Python的数据结构1.5Python的控制流语句1.6Python中的异常处理和调试1.7函数调用和定义以及函数的参数1.8Python的类和面向对象编程1.9Python的文件、模块操作1.10其他高级特性练习项目:-蒙特卡罗模拟求圆周率-冒泡算法和二分查找-实现计算器-堆栈和队列的实现-模拟实现ATM机取钱-求阶乘-模拟管理学生成绩信息-编程实现24点扑克游戏-会员信息管理的实现-虚拟水果店进销存系统-投票系统-汉诺塔问题-离散事件模拟- 堆排序的实现Level 2:Python数据清洗及统计描述 5月13-15日三天 北京/远程 2400/2000课
4、程大纲:一,Numpy(NumericalPython)是高性能科学计算和数据分析的基础包,是数据分析几乎所有的高级工具的构建基础。Numpy基础-Numpy的ndarray-数组的索引和切片-数组的运算-常用的数组方法二,Pandas包提供了大量能使我们快速便捷地处理数据的函数和方法,它是Python成为强大而高效的数据分析环境的重要因素之一。Pandas基础应用-Series数据结构-DataFrame数据结构-基本功能-汇总和计算统计描述-缺失值的处理Pandas数据规整-数据加载&输出-数据集的合并-数据集的重塑-数据重构Pandas分组运算-GroupBy技术-数据聚合-分组级运算和
5、转换-透视表和交叉表Level 3:Python爬虫 5月20-21日 北京/远程 1600/1300课程大纲:一,爬虫初级-认识HTTP协议和Cookie及HTML介绍-网络请求(urllib以及requests的介绍和安装)-使用BeautifulSoup4库(静态网页解析)-使用lxml库(XPath语法解析静态网页)-Python连接数据库(数据保存)-logging、time模块的学习-正则表达式的使用二,爬虫高级-动态网页的抓取(PhantomJS和Selenium的使用)-Scrapy爬虫框架的安装和学习-多线程爬虫-规避网站信息采集陷阱Level 4:Python数据挖掘、机器
6、学习算法案例 5月27-30日四天 北京/远程 4200/3600Python案例分析大全(但不局限于):1.文本挖掘原理和案例-数据可视化的各种方式2.预测分析核心算法-Python图片结构和分析(图片的k-means聚类分析)3.机器学习经典算法-图片的识别和分类:PCA建模4.Python概率统计-二维手写数字识别(KNN方法)5.数据可视化-推荐系统的构建(最近邻方法、协同过滤)6.Python经典金融分析-垃圾短信或邮件的识别与分类(Logistic对文本的分类)7.Python量化投资-新闻的文本分类(TF-IDF准则、旅游新闻个性化推荐)8.算法和模型的优化-人脸识别9.模型精度
7、评估和提升-朴素贝叶斯决策10.特征选取的方法-酒的品质分类预测11.最佳k-means分类数-机器学习的格点搜索和参数寻优12.交叉验证(CV)-惩罚线性回归分类器13.不平衡数据处理-使用支持向量机识别和分类14.XGBoost-时间序列预测案例15.贝叶斯分析-机器集成学习算法案例16.逼近和最优化-Python随机模拟案例17.概率图模型-Python金融分析案例18.马尔科夫&蒙特卡罗-使用Python进行量化投资案例Python量化投资 4月15-16,22-23日 四天 北京/远程 4500/3600课程大纲:基础班(一天):Python语言基础与金融统计分析Part1:Pyth
8、on语言学习与应用1、Python语言简介2、运算符与表达式3、Python控制流4、Python函数5、Python模块6、异常处理与文件操作7、Python绘图8、Numpy篇9、Pandas篇10、数据库连接Part2:金融统计分析概论1、统计学理论 (1)统计学概论 (2)描述性统计 (3)参数估计 (4)假设检验 2、多变量相关性分析3、线性回归模型案例分析:案例一:大型股票数据库读取股票数据案例二:A股市场股票数据绘图案例三:交易数据描述性统计案例四:非金融专业数据获取方法实战班(三天)第一天:Part1:金融数据处理高级编程1、Pandas深入分析2、金融因子数据生成3、常见的金
9、融数据整理方式Part2:量化投资概述 1、投资策略回顾与比较 2、基本面、技术分析和量化的联系与区别 3、量化投资概述4、量化投资风险与管控Part3:量化投资Python平台介绍1、数据获取2、回测框架介绍3、回测注意问题。案例分析:案例一:市盈率手动计算案例二:Panel数据的存储与提取案例三:简单的均线穿越策略实现第二天:Part1:市场描述策略描述性研究Part2:高级交易策略1、CTA策略2、大师选股策略3、市场中性选股策略4、技术指标类策略5、资产配置策略Part3:时间序列模型1、什么是时间序列数据 2、时间序列的平稳性检验与白噪声探讨 3、时间序列平滑 4、【SMA、WMA
10、EWMA】5、金融时间序列建模预测6、【ARMA、ARIMA模型】7、波动的集聚效应 案例分析:案例一:如何通过各种数据描述当前市场状态案例二:CTA策略案例三:经典大师选股策略案例四:市场中性选股策略案例五:技术指标类选股策略案例六:资产配置策略案例七:时间序列策略第三天:Part1:投资组合基本概念1、超额Alpha选股2、CAPM模型3、三因子模型选股Part2:投资组合构建1、单因子测试2、多因子测试3、常见的组合构建方法Part3:数据挖掘算法在量化投资中的运用 1、逻辑回归与涨跌预测 2、支持向量机模型与涨跌预测 3、聚类与股票配对 Part4舆情分析与关注度模型 1、文本挖掘概述
11、 2、文本处理技巧3、中文分词案例分析:案例一:单因子全套测试代码案例二:组合构建案例案例三:文本数据处理案例Python统计计量 4月28-5月1日四天 上海/视频 3200/1500课程大纲:Part-1 Python初探01.Python语法结构概览教学内容:兼顾应用广泛的Python 2.x与日益兴盛的Python 3.x,从最基本的原理和语法格式入手,教授Python的基础内容。教学目的: 深入Python的流程控制语句,夯实基础,这部分内容将贯穿课程始终,熟练到就算没有开放的扩展库,自己也能根据公式做模型。1.1 一个概览式的例子1.2 基本语法与数据1.3 条件与条件语句1.4
12、循环与嵌套1.5 循环控制语句02.Python函数与数据结构教学内容: Python基础的核心内容。教学目的: 了解各类函数、参数和变量的区别和联系,能够提升编程质量,使内容更加完善与流畅。2.1 认识与定义函数2.2 参数形式与返回值2.3 内置函数形式2.4 变量类型及应用2.5 数据结构及应用03.数据处理与计算教学内容: 介绍的丰富且成熟的第三方扩展库,解读数据分析的逻辑和分析结果。教学目的:学会使用Python进行更加便捷的数理统计与计量分析,结果更加全面,解释性更强。3.1 常用模块概览3.2 数据的导入与导出3.3 描述性数据统计3.4 两总体对比推断3.5 方差分析3.6 卡
13、方检验3.7 非参数统计分析04.数据清洗教学内容: 检查数据一致性、处理无效值和各种填补缺失值的方式。教学目的: 迈出数据处理的第一步,能够识别并处理不清洁的数据,使数据更有利于后续的数据分析与挖掘。4.1 数据的整理4.2 数据的集成4.3 原始数据变换4.4 数据归约4.5 处理缺失值Part-2关于截面数据05.线性回归模型教学内容: 学会使用最单纯也是最实用且频频出现在Top期刊中的线性回归模型。教学目的:学会使用Python固定语句进行回归,合理地构建模型、选择变量、解释结果。5.1 小样本&大样本OLS5.2 使用虚拟变量5.3 非线性回归处理5.4 异方差5.5 自相关5.6
14、主成分分析(PCA)与因子分析(FA)06.内生性的解决办法教学内容: 处理各类研究中如影随形的内生性问题。教学目的:能够完爆一个内生性,并使用Python处理内生性,使论文轻松达到“A-level”。6.1 工具变量法(IV)6.2 两阶段最小二乘拆解内生性(2SLS)6.3 广义矩估计(GMM)6.4 倍分法07.离散变量模型教学内容:介绍最早的离散选择模型Logit/Probit模型,这是很多0/1选择问题的主要方法,也是社会学、心理学、经济学、市场营销等统计实证分析的常用方法。教学目的:学会针对不同的问题选择合适的离散选择模型解决问题,并解释结果。7.1 二值型Logit/Probit模型7.2 多值型Logit/Probit模型7.3. 定序Logit/Probit模型7.4 计数模型Part-3关于时间序列08.平稳时间序列分析教学内容: 时间序列分析的基础,一般的时间序列分析往往都是针对平稳序列,对于一些非平稳序列,也会通过某些变换转成平稳序列来处理。教学目的: 学会识别平稳时间序列,并使用Python进行一系列后续分析与预测,得出并解释分析结果。8.1 时间序列特征8.2 ARMA基本逻辑及应用8.3 自回归分布滞后模型8.4 自相关与偏自相关8.5 向量自回归09.非平稳时间序列教学内容:与平稳时间序列具有截然不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度桥梁工程施工现场管理合同5篇
- 2024年度网络安全维护服务合同协议
- 04年地基工程保险合同2篇
- 2024年度设备供应商施工配合合同
- 2024年度施工合同范本:公共设施建设与工程款支付
- 2024年度融资租赁合同标的:设备租赁与资金回流
- 2024年度公墓文化研究与发展合作协议
- 2024年度游戏开发运营合同
- 2024年度风力发电机组配件购销合同
- 二零二四年度汽车行业人才租赁合同
- 工伤赔偿的确认书范文合集3篇
- 2024年度《给教师的一百条建议》读后感课件
- 拔牙护理查房
- 发改委项目可行性研究报告编写指南
- 《上海车展报告》课件
- 血液透析病人的饮食指导
- 初中数学基于核心素养导向的大单元教学设计(共50张)
- 数学象棋:将数学应用于象棋策略和思考
- ETI 基本准则Base Code-中文OK
- 光伏发电项目技术标投标文件
- 幼儿细菌科普知识
评论
0/150
提交评论