新股上市时合理定价区间预测(总报告).ppt_第1页
新股上市时合理定价区间预测(总报告).ppt_第2页
新股上市时合理定价区间预测(总报告).ppt_第3页
新股上市时合理定价区间预测(总报告).ppt_第4页
新股上市时合理定价区间预测(总报告).ppt_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、新股上市合理定价区间预测,二五年四月,日期: 2020/12/14,目录,项目概述 时间安排 研究内容 团队分工 源数据表 数据预处理 数数据转换和处理据转换和处理 数据模型演算及项目展望 知识发现,日期: 2020/12/14,项目目的,1.11.1项目目的 基金金融工程数据库中有着中国一千多只股票及几百只基金的基础财务数据、股权信息、资本运作信息及每个交易日的行情公告信息。金融工程数据库是一个海量的数据。作为基金管理单位,针对如此海量的信息记录,如何保证从这些数据中提取关键信息,找到有潜力的股票,改善持股结构, 为基金管理部门相关决策提供依据与向导,是我们数据挖掘的目的。因为这个题目太大,

2、我们选择其中一个较小范围的新股发行方面的数据进行挖掘。 新股发行时,每个股票有所属行业,募集资金合计,发行市盈率,二级市场配售发行数量,预测净利润,上市首日表现等可统计信息。对这些数据进行挖掘,预测某只规模的新股上市时合理定价区间。过程中需要运用数据挖掘课程中的一些关键技术和思想,比如聚类分析、OLAP、决策树等方法体现在数据的抽取、数据的存储和管理、数据的展现和预测价值等过程中,日期: 2020/12/14,项目步骤,确定项目目标; 选取典型范围的新股上市的数据源与相关数据字典; 数据库建立与数据清理工作; 定义数据堆积维度和衡量值; 确定数据挖掘的理论方法(聚类、决策树); 学会应用Mic

3、rosoft SQL Server 2000 Enterprise 和Analysis Server OLAP/Data Mining工具; 设计定义挖掘模型和算法; 预测结果测试,1.2 项目步骤,日期: 2020/12/14,项目概述,1.3 项目步骤图,项目步骤图,日期: 2020/12/14,1.4 工具介绍,SQL Server 2000 为用户提供了大规模联机事务处理 (OLTP)、数据仓库和电子商务应用程序所需的最新的出色数据库平台。SQL Server 2000 为用户提供了完全集成的可扩展标记语言 (XML) 环境、在分析服务中添加了新的数据挖掘功能、用元数据服务增强了知识库

4、技术,项目概述,工具介绍,日期: 2020/12/14,目录,项目概述 时间安排 研究内容 团队分工 源数据表 数据预处理 数数据转换和处理据转换和处理 数据模型演算及项目展望 知识发现,日期: 2020/12/14,总体时间安排,小组各成员分工协作,完成各自的目标,完成课题报告初稿,开题预备,报告定稿,答辩,提交结果报告,确定课题研究内容和方向 并明确各成员分工,课题研究,课题结束,日期: 2020/12/14,目录,项目概述 时间安排 研究内容 团队分工 源数据表 数据预处理 数数据转换和处理据转换和处理 数据模型演算及项目展望 知识发现,日期: 2020/12/14,研究内容,3.1 建

5、立基本概念,数据挖掘概念 ; 可用于数据挖掘的数据类型 ; 数据挖掘功能及挖掘类型的模式 ; 数据挖掘系统了解 ; 数据挖掘预处理 ; 决策树概念与算法了解 ; 其它挖掘模式的了解,建立基本概念,日期: 2020/12/14,3.2 数据源,基金金融工程数据库 ; 新股发行主要部分; 证券列表, 公司列表, 板块列表 ; 上市公司财务数据 ; 股票交易数据 ; 上市公司股权信息; 上市公司高管信息; 其他信息(法人代表、注册地址、邮编、电话等),研究内容,数据源,日期: 2020/12/14,3.3 算法研究,基本上我们小组采用决策树算法。 决策树算法是以树的结构显示的分类形式,其中树结构中的

6、节点代表进一步对数据进行分类的单个问题。创建决策树的各种方法数十年来广泛使用,而且有大量的著作讲述这些统计技术。 决策树挖掘模型使用名为递归分区的过程,根据事例集提供的特性将数据划分为若干个分区。然后,它将这些新建分区划分为更多的分区,并且一直划分下去,直到无法执行有用的划分,研究内容,算法研究,日期: 2020/12/14,目录,项目概述 时间安排 研究内容 团队分工 源数据表 数据预处理 数数据转换和处理据转换和处理 数据模型演算及项目展望 知识发现,日期: 2020/12/14,团队分工,小组各成员都分别负责课题的一部分研究内容,每个人都是课题能顺利完成不可缺少的一部分,日期: 2020

7、/12/14,目录,项目概述 时间安排 研究内容 团队分工 源数据表 数据预处理 数数据转换和处理据转换和处理 数据模型演算及项目展望 知识发现,日期: 2020/12/14,1.1.1.1.1 行情(TB_OBJECT_1120) 主键:OB_OBJECT_ID 唯一性约束:(F1_1120, F2_1120,行情(TB_OBJECT_1120,行情,日期: 2020/12/14,新股发行(TB_OBJECT_1095,新股发行,日期: 2020/12/14,证券(TB_OBJECT_1090,证券,日期: 2020/12/14,2.数据仓库模型设计及建立,行业大类,数据仓库,日期: 202

8、0/12/14,目录,项目概述 时间安排 研究内容 团队分工 源数据表 数据预处理 数数据转换和处理据转换和处理 数据模型演算及项目展望 知识发现,日期: 2020/12/14,6.1数据清理原则,基金金融工程数据库中新股上市时信息数据 上市首日涨跌情况作为数据挖掘的重要指标 历年来的不同盘子、不同市盈率、不同行业的新股上市时首日涨跌幅度的大小,具有预测价值,数据清理原则,日期: 2020/12/14,6.2数据清理过程,数据清理过程,过程中需要运用数据挖掘课程中的一些关键技术和思想,比如聚类分析、OLAP、决策树等方法体现在数据的抽取、数据的存储和管理、数据的展现和预测价值等过程中。 预测一

9、定经营规模企业具有良好盈利率曲线的所在行业、所属类型,日期: 2020/12/14,6.3研究目标数据,从1991-2005年的股票发行范围内进行数据提取; 新股发行主要成分 证券列表, 公司列表, 板块列表; 上市公司财务数据 股票首日交易数据,研究目标数据,日期: 2020/12/14,目录,项目概述 时间安排 研究内容 团队分工 源数据表 数据预处理 数据转换和处理据转换和处理 数据模型演算及项目展望 知识发现,日期: 2020/12/14,7.1确定对象数据表关系,确定对象数据表关系,日期: 2020/12/14,7.2定义数据维度,定义数据维度,日期: 2020/12/14,7.3多

10、维数据集处理过程,多维数据集处理过程,日期: 2020/12/14,7.4数据集查看,数据集查看,日期: 2020/12/14,目录,项目概述 时间安排 研究内容 团队分工 源数据表 数据预处理 数据转换和处理据转换和处理 数据模型演算 知识发现及项目展望,日期: 2020/12/14,8.1微软决策树,微软决策树,决策树是以树的结构显示的分类形式,其中树结构中的节点代表进一步对数据进行分类的单个问题。创建决策树的各种方法数十年来广泛使用,而且有大量的著作讲述这些统计技术。 决策树挖掘模型使用名为递归分区的过程,根据事例集提供的特性将数据划分为若干个分区。然后,它将这些新建分区划分为更多的分区

11、,并且一直划分下去,直到无法执行有用的划分,日期: 2020/12/14,8.2挖掘模型,挖掘模型,日期: 2020/12/14,8.3挖掘结果查看,挖掘结果查看,日期: 2020/12/14,目录,项目概述 时间安排 研究内容 团队分工 源数据表 数据预处理 数据转换和处理据转换和处理 数据模型演算 知识发现及项目展望,日期: 2020/12/14,知识发现,知识发现,通过上述的数据演算和分析不难看出: 上市新股中的小盘股涨幅大部分为1-5倍,而大盘股涨幅大部分都在1倍以内,说明小盘股首日的表现最佳; 新股上市首日的表现基本与市盈率大小基本无关,说明中国股市还不成熟,投机成分较大,日期: 2020/12/14,项目展望,项目展望,因为时间上的原因,以及小组成员都全职进行自己的工作,最近所学的课程考

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论