2023年数理统计综合作业解析_第1页
2023年数理统计综合作业解析_第2页
2023年数理统计综合作业解析_第3页
2023年数理统计综合作业解析_第4页
2023年数理统计综合作业解析_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

4祖孽

“数理记录”课程综合作业

作业规定

为了考核同学们综合运用记录方法解决实际问题的过程,请同学们结合当前

社会生活实际中的问题,自己拟定一个研究题目,并应用参数估计、假设检查、

回归分析、方差分析、正交设计(这些方法中至少选择两个)对其进行分析。

规定:

(-)内容

必须涵盖以下几个方面:1.题目2研讨的问题是什么;3.相关的数据及来源;4.

建立的记录模型和记录问题是什么,样本数据是什么;5.使用的记录方法是什么?使

用的记录分析软件是什么?5.计算过程(若记录软件,其计算结果是什么)6.对

计算结果的说明或解释。

(二)格式

涉及报告题目、摘要、正文、参考文献和附录五个部分。正文内容一般涉及

问题描述、数据描述、模型建立、记录方法选择和问题求解、结果分析等内容。

报告用Word文本格式,中文字使用宋体、小四号字,英文用Roman字体5号字,

数学符号用MathType输入。

题目(黑体,三号)

摘要:(200—400字)(黑体,小四)

正文(正文标题:宋体,粗体,小四)

一、问题提出。(正文内容:宋体,五号)

二、数据描述(用表格表达数据信息,指出数据来源或提供原始数据)

三、建立记录模型

四、记录方法设计和方法使用的条件,计算工具的选择。

五、计算过程和计算结果。

六、结果分析。

参考资料(标题:宋体,粗体,小四,内容:宋体,五号)

附录(标题:宋体,粗体,小四,内容:宋体,五号)

(三)课外作业提交形式

纸质材料和电子文档

注意:纸质材料打印内容从封面开始,涉及作业规定,直至作业的所有内容。

电子文档:先提交给班长,再由班长将压缩文献提交给老师。特别注意电子

文档的名称,按如下模板写:2023级某班“数理记录”综合作业——姓名,学号。

(四)课外作业提交时间

参与课程考试那天上午提交纸质材料,当天班长提交电子文档给老师。

请注意:不能复制现有成果,同学之间也不能互相复制内容。

股票市场中变量之间的关系

摘要:

在经济飞速发展的当代,金融市场占据着半壁江山,而在金融市场中股票作

为公司筹资的重要来源,它占据着重要的地位,我接下来就是要研究股票市场中变

量之间的关系,通过记录分析方法还原大数据时代海量数据所反映的事实,以及数

据之间的规律性。

一方面用记录中的参数估计的方法对所得数据进行分析建立模型Y=X(3+W,

对搜集到的数据做参数估计,即最小二乘估计。然后对数据建立回归预测的模型,

用回归分析的方法对搜集到的中证10。股指的数据建立线性模型,用R软件编程进

行求解,最后求出B的估计值并用R软件画出残差图并与实际走势相比较。最后

对所得结果进行分析,联系实际的K线图,检查预测的效果,对R软件中得出的异

常点进行分析,用三种不同的方法得到的结果进行比较,分析本次分析对实际问题

的实用性。

中证100指数的回归分析

问题的提出

生活在21世纪,这个信息的海洋里,天天都面对着海量的数据,而与我们并不遥远的金融

市场更是信息的集中体,股票期权等每秒都有上亿的数据信息量,面对如此多的数据信息,

如何才干从众多的股票中选出优质股进行投资成为人们争夺的热点,其实我们可以用记录的

方法来解决这些问题。

下面便针对这种现象提出如下的问题:请搜集有关股票数据并对其变量用记录方法进行

分析。

二.数据描述

在大智慧软件上搜集中证100的指数,并对中证100支成分股搜集15分钟k线的收盘价,共352组样本数据得到如下

数据•:(具体见附

录)

深发展万科A招商地产中兴通讯华侨城A中联重科美的集团潍柴动力徐工机械云南白药宏源1

收盘收盘收盘收盘收盘收盘收盘收盘收含收盘收盘

14.479.945.6110.756.964.0832.720.398.7105.51

14.439.925.6310.86.994.132.6220.428.73105.52

14.479.975.6410.826.984.0932.4320.48.73104.65

14.54105.6210.886.984.1132.5420.418.72104.62

14.5910.035.6110.836.954.1332.5220.398.78104.4

14.5610.015.610.836.944.1232.1620.568.78104.12

14.56105.610.86.954.1232.1820.468.77104.39

14.519.975.610.836.94.1132.1520.458.79104.19

14.549.965.5910.816.934.1132.1320.458.74105.18

14.539.955.6110.896.914.113220.428.7104.81

14.549.925.611.096.954.1232.2520.428.73105

14.499.755.559811.136.99784.1232.2220.68.6699105.52

14.429.85911.166.954.1132.220.5572105.56

6.

14.419.765911.1964.1232.1820.477106.31

14.369.745.5711.226.954.1232.2820.488.69106.88

14.389.85.11.36.4.0932.1920.438.106.9

775.566.928.74

14.459.785.5611.274.0932.0520.42872107.61

9.•

14.38765.5511.26.914.0832.1620.45873107.73

9.5.•

14.379.735511.236.924.0932.220.3587107.6

14.45.5311.226.94.0832.1320.2­106.74

9745.72

14.349715.5411.186.94.0732.1420.198.71107

14.3535411.226.884.063420.178.9107.11

g68.6

14.33g6411.166.854.053420.21106.66

14.299635311.176.84.0533.620.28.63106.48

14.215211.326.844.0533.520.118.66108.49

SheetlSheet2।…+

三.建立记录模型

对搜集到的数据进行建模,由于影响因变量中证100收盘价Y的共有100支股票,设这一百只股票分别为XI,

X2,X3.....X99,X100.

这100个变量与Y有如下相关关系:

Y=/+-X]+.・.万IOOMOQ+£

其中£~N(0,cr2)且cov(£j,£j)=0,iWj.

即建立了线性模型:

Y=xB+£

E£=0,cov(£)=cr2I

参数估计:

对上述建立的模型进行参数估计,设夕=(四).四,…,四00)

AAAA

为P的估计量,则称y=/?0+0\%+...+,io()X]0n为线性回归方程,

残差平方和为髭=5沥)=2(》—…—鼠/成=y-x^||=

AAA

YY-2YX/3+/3'X'X

给定观测数据(项1,冷,%,…,x“oo,X)i=1,2,3...100

A

B就是吸is九夕)的最优解

d

即三S;9(0=o(1)的解

dp

由⑴式可知XT=X'X/?为正规方程rank(X'X)=rank(X)=p+1

A

所以得到月的LS估计为尸=(X,X)TXY

AA

即y=x==x(x,x)Txu

四、记录方法设计和方法使用的条件,计算工具的选择。

用用R软件对所搜集的数据进行用回归分析的方法对最小二乘估计进行计算,并用

回归分析建立回归模型,一方面把数据中缺失的即停盘的股票删去,并将缺失的补齐,另存为

Csv文献,下面在R软件中编程进行解答。

下面是程序

DA=read.csv(file=fi1e.choose(),head=T)

>1ibrary(nnIs)

>x=as.matrix(DA[,2:101])

>y=as.vector(DA[,1])

>a=2:101

>b=0.

>D=data.frame(a,b)

>b0=as.vector(D[,2])

>yl=y-x%*%b0

>nnr<-nnls(x,yl)

>nnr

>coef<-coef(nnr)+0.

>coef

五、计算过程和计算结果。

对数据做正回归分析得出结果:

coef(提取系数向量的估计值)

[1]1.45.14.0.2.6.0.9.36.0.0.

[12]0.0.0.3.0.1.1.0.0.00.

[23]0.0.14.31.0.00.18.0.0.0.

[34]0.0.0.0.512.0.00.0.0.

[45]0.0.0.0.0.0.1.0.0.0.29.

[56]3.0.04.0.0.0.0.0.0.0.

[67]0.1.00.0.0.0.0.0.0.

[78]1.00.0.6.00.000.0.

[89]0.23.17.0.0.0.003.0.0.

[100]0.

xestimates:1.98584745.7245514.3457902.9009976.5403440.11

419319.68372536.471360.6819832000.835112203.4712090

1.4885411.50055200000014.4266131.7055200018.460300

000005.24335112.3539700000000.6712933000

1.63136900029.401853.856018004.29837600000000

1.42559200011.10205000001.0442180006.580220000

0.79958740023.8511717.24039000003.079216000

residualsum-of-squares:9190

由X的估计值得到下列回归方程:Y=l.985847x1+45.72455x2+14.34579x3+2.90

疑RGraphics:Device2(ACTIVE)m’亘回卜

050100150200250300350

Time

RRGraphics:Device2(ACTIVE)

CD回

time

从上图可以看出本次回归预测与实际走势基本吻合。

六、结果分析。

下面对结果进行分析:

分析方法:正态性检查

本次检查选用了较为简朴的QQ图进行检查分析,在R软件中输入以下的程序:

DA=read.csv(file=fi1e.choose(),head=T)

Im.sz=lm(Y、Xl+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12+X13+X14+X15+X16+X

17+X18+X19+X20+X21+X22+X23+X24+X25+X26+X27+X28+X29+X30+X31+X32+X33

+X34+X35+X36+X37+X38+X39+X40+X41+X42+X43+X44+X45+X46+X47+X48+

X49+X50+X51+X52+X53+X54+X55+X56+X57+X58+X59+X60+X61+X62+X63+X64+X6

5+X66+X67+X68+X69+X70+X71+X72+X73+X74+X75+X76+X77+X78+X79+X

80+X81+X82+X83+X84+X85+X86+X87+X88+X89+X90+X91+X92+X93+X94+X95+X96+X97

+X98+X99+X100,data=DA)

summary(Im.sz)

plot(1m.sz,2)#对数正态QQ残差图

KKGraphics:Device2.(ACIIVt)[匕||M||络

s

ro

pn

S-

p

Z

_

P

B

P

U

£

S

从图中可以看出第139,321,76组的数据异常

下面对数据异常点进行诊断分析:

程序为:p=l

n=nrow(DA)

d1=dffits(Im.sz)

cf=1:n

cf[abs(d1)>2*sqrt((p+1)/n)]

32r2

495699三三三S.9勺勺3970—ONO3OO€€l-a

库3210

#二

3220e-2€6334e—06□,4368032

3一X.0972。。=—049252XOS3

3200:13€q:Nq

w一T.S3T247e—O€O23OST9-7

i320s7s9205

ns7-089359=—。399387940

3260Tl09q75s0

1.6767NS0一。3O€9O€132

32707er4:3928

32_015.-7384930—03-483©9129

D82s769801

=c3290€.S9€881e—0-470600932

-2工359。5724.5T6O590—。41552232S

0

330_521295662.2.69S19O.e—03S6S3433*7

4

(1/3工098287-597□..€€2GO9e—03.S7263-096

2

332二0375928095S.-3-323S3e—0213.7-39922

3_N72789mq

33301•62.O3_22.e-0-409099003

rs=33T018-763€Xa--a3-4982X3e—04e68Xe€7©

335一•G2-43CS9S61.7S€X7Se—03s7-esooes

一0

33605988933963.54S82Oe—0308001928

Sd=3370TN5-7ST8。2X.-79e6Sle—03,75-5-74030

sse0勺1212^79011-€833OSe—033SO3S2SS

33909328922.23.8.S25343e—0342109272.

ha"o0320502G2-21-019300.^—03sssesss6

343.069勺€757724-7538070—03726WN795

342036O98S7O7□_.29253,7e—0348S9172S

S(343002952.e27Se.ceiseses—ocSO921933.

_

3。W02,7€V675S87-6O4O3_4e-0459036213

345_0O5-aa.3_9O3_62.9X2_2€9e—05"739550.25

O7SH-71X

#招4€_0勺99761.SS2O5^7e—03

3470OH5S8V65□..335。:13——。€S24S22S3

348

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论