版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章导论概念: 统计学:收集、处理、分析、解释数据井从数据中得出结论的科学。统计的分类:描述统计:研究的是数据收集,处理,汇总,图表描述,文字概括与分析等统计方法。推断统计:是研究如何利用样木数据进行推断总体特征。数据:1分类数据:对事物进行分类的结果数据,表现为类别,用文字来表述。例如,人口按性别分为男、女两类2顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等3数值型数据 对事物的精确测度,结果表现为具体的数值。 例如:身高为175cm, 190cm,200cm 参数:描述总体特征。有总体均值(卩)、标准差()总体比例(T)统计量:描述
2、样本特征,样本标准差 (s),样木比例(p)描述统计推断统计参数估计假设检验统计数据的分类据第二据数据的搜据1. 数据来源包括直接来源(一手数据) 和间接来源(二手数据)2. 抽样方式包括概率抽样与非概率抽样3. 概率抽样:也称随机抽样。按一定的概率以随机原则抽取样本,抽取样本时使每个单位都有一定的机会被抽中。概率抽样简单随机分层抽样整諭样系魁样辔抽4.5. 抽样误差:是由抽样的随机性引起的样本结果与总体真值之间的误差。抽样误差并不是针对某个样本的检测结果与总体真是结果的差异而言,抽样误差描述 的是所有样本可能的结果与总体真值之间的平均差异。6. 抽样误差的大小与样本量的大小和总体的变异程度有
3、关。第三章 数据的图表展示计算机实训内容,要求:1. 数据筛选,自动筛选2. 高级筛选,3. 数据排序4. 分类汇总-利用数据透视表5. 对比条形图6. 环形图7. 累计频数图8. 散点图9. 雷达图 等等频数分布图两种方法:工具-数据分析-直方图 数值型和顺序数据数据-数据透视表数据透视表第四章 数据的概括性度量:集中趋势11离散程度分布的形状1异众比率偏态TA中位数四分位差均|値平均差差和标准差离散系数峰度集中趋势:算数平均数:几何平均数:指n个观察值连乘积的n次方根,计算平均发展速度时复利下的 平均年利率,最常用的一种计算公式为,几何平均数w算术平均数。中位数:有限的数集,可以通过把所有
4、观察值高低排序后找出正中间的一个作为中位数。(平均家庭收入)(记忆的重要性)离散程度:异众比率:异众比率指的是总体中非众数次数与总体全部次数之比。(了解)四分位差:(了解)方差:var标准差:STDEV平均差:iX厂*M_ 1=1M 0 相对位置的度量:标准分数:离散系数:形状:偏态:SK>0 ,正值,正偏或者右偏,右偏分布k,小数集中SK<0,负值,负偏或者左偏,绝对值 0,0.5,1三个界线峰态:K>0 ,尖峰,数据分布集中,左僑分布,大数集中K<0 ,扁平,数据分布分散第五章概率与概率分布1. 概率的分类:1.概率的古典定义,概率的统计定义,概率的主观定义。2.
5、期望值:在离散型随机变量 X的一切可能取值的完备组中,各可能取值xi与其取相对应的概率pi乘积之和,描述离散型随机变量取值的集中程度,记作E(X),或者,其实为加权平均数。3. 二项分布的数学期望为E ( X )= np方差为D ( X )= npq标准差?区别二项分布的概率值与期望值。4. 当二项分布中n很大,p很小时,二项分布就变成为Poisson分布计算机计算二项分布计算时候,已知:1,目标概率 2,实验次数3,成功次数公式:C成功的次数(目标概率)成功的次数(1-目标概率)失败的次数二项分布换泊松分布, 已知:1,入=np=1*22,成功的次数(揉合在一起,因为都是那种目标概率小、实验
6、次数多的实验)入=数学期望值E (X)=方差D(X)=npP119例子,P121例子正态分布主要特点:钟型,离 卩近的概率大,离远的概率小。标准差小,集中;标准差大,分散。正态曲线的最高点在均值 卩,它也是分布的中位数和众数。正态分布是一个分布族,每一特定正态分布通过均值和标准差6来区分。曲线f(x)相对于均值卩对称,尾端向两个方向无限延伸,且理论上永远不会 与横轴相交正态曲线下的总面积等于 1。计算机计算:已知:1,正态分布(的形状)(与6), 2临界值(右端值,即默认计算 的是改值以左部分的面积)5. 标准正态分布:期望值卩=0 ,(即曲线图象对称轴为 Y轴),标准差6=1条件下的正态分布
7、,记为N(0 , 1)。 (N是正态英文的首字母)计算:由于形状已知(N(0 , 1),所以只需要知道 临界值(右端值)6. 此段内容只供理解,不是知识。概率函数:横轴表示“统计对象”,纵轴表示”概率”。故称概率函数。概率密度函数:将直方图组距缩小到很密的程度,故称概率密度函数。分布函数:分布函数F(x)在x处的函数值就表示 X落在区间(-g ,x上的概率。(把概率函 数的面积转换成分布函数的纵轴值)所以:找一个的具体值的概率 应该在密度函数上的值,范围区间(-g ,x是在分布函数上的值,一个范围区间(X1X2 )是分布函数上X2的值-X1的值7. 正态分布的3 b原则:只要是正态分布,不论标
8、准与否,(可以反过来理解)数值分布在(v b卩+ b)中的概率为0.6826数值分布在(v-2 b, v+2 b中的概率为0.9544数值分布在(v-3 b, v+3 b中的概率为0.9974可以认为,Y的取值几乎全部集中在(甘3 b, v+3 b区间内,超出这个范围的可能性仅占不到0.00268. 正态分布表9. 其他公式:P (a< X <b)-® 一 0(口)P(|X| <a)= 20(a) -110. 正态分布的标准化公式:Z=(X- 训bN(0,1)(EXCEL实例)样本,当n充分大时,样本均值的抽样分布近似服从均值为方差为小2/n的正态分布。4.(那么标准差呢?)非正态分布大样本正态分布L1带本J正态分布LJr1;大样本正态分布LJ小样本菲正态分布4.4.理解:m为总体个数,n为抽样时每个样本的个数,可以抽出Cm个样本,这些样本符合正态分布。第七章:参数估计1. 参数估计:根据统计量计算推断出总体低的参数,包括点估计和区间估计2. 点估计:点估计3. 区间估计:条件1均值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 地面辐射供暖系统地面砖面层施工技术探讨
- 初一理化生神经系统组成
- 语法练习和答案-定语从句练习
- 高中语文专题3文明的对话第12课传统文化与文化传统课件苏教版必修
- 2024-2025学年八年级上学期英语期中复习之Unit1~unit4语法复习及练习(译林版)
- 专业技术人员继续教育答案职业生涯规划与管理满分
- 六年级心理健康教育教案参考修改版
- 汇率制与汇率政策
- Unit 5 A healthy lifestyle Reading2课时练(无答案)
- 部编版二上语文识字4田家四季歌图文
- 期末综合素养评价一(试题)-2024-2025学年三年级上册科学教科版
- (新版)特种设备安全管理取证考试题库(浓缩500题)
- 高二语文上学期期中模拟试卷03(解析版)
- 公司信息化调研情况汇报(4篇)
- 养猪合伙协议合同模板
- 期中测试卷-2024-2025学年统编版语文五年级上册
- 小学数学小专题讲座《数学教学生活化-》
- 2024年秋国家开放大学《形势与政策》大作业试题:中华民族现代文明有哪些鲜明特质?建设中华民族现代文明的路径是什么?【附:2份参考答案】
- 北师大版(2019) 选择性必修第一册 Unit 3 Conservation Lesson 3 The Road to Destruction教案
- 黑龙江省哈尔滨市第四十七中学校2024-2025学年(五四制)九年级上学期9月月考语文试题
- 教科版五年级上册科学全册教学反思
评论
0/150
提交评论