深入浅出统计学_第1页
深入浅出统计学_第2页
深入浅出统计学_第3页
深入浅出统计学_第4页
深入浅出统计学_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

/23入浅出统计学》具有深入浅出系列的一贯特色,提供最符合直觉的理解方式,让统计理论的学习既有趣又自然。从应对考试到解决实际问题,无论你是学生还是数据分析师,都能从中受益。本书涵盖的知识点包括:信息可视化、概率计算、几何分布、二项分布及泊松分布、正态分布、统计抽样、置信区间的构建、假设检验、卡方分布、相关与回归等等,完整涵盖 AP考试范围。本书运用充满互动性的真实世界情节,教给你有关这门学科的所有基础,为这个枯燥的领域带来鲜活的乐趣,不仅让你充分掌握统计学的要义,更会告诉你如何将统计理论应用到日常生活中。总目录序言xxviiTOC\o"1-5"\h\z信息图形化:第一印象 1集中趋势的量度:中庸之道 45分散性与变异性的量度:强大的“距”83概率计算:把握机会 127离散概率分布的运用:善用期望 197排列与组合:排序、排位、排241几何分布、二项分布及泊松分布:坚持离散 269正态分布的运用:保持正态 325再谈正态分布的运用:超越正态 36110统计抽样的运用:抽取样本 41511总体和样本的估计:进行预测 44112置信区间的构建:自信地猜测 48713假设检验的运用:研究证据 521142分布:继续探讨••••56715相关与回归:我的线条如何?605附录i尾声:正文未及的十大拓展 643附录ii统计表:快来查表 657细分目录及各章引子序言大脑对待统计学的态度。一边是你努力想学会一些知识,一边是你的大脑忙着开小差。你的大脑在想:“最好把位置留给更重要的事,像该离哪些野生动物远点啊,像光着身子滑雪是不是个坏点子啊。”既然如此,你该如何引诱你的大脑意识到,懂得统计学是你安身立命的根本?谁适合阅读本书?xxx我们了解你在想什么xxxi元认知xxxiii征服大脑 xxxv本书自述 xxxvi技术顾问组 xxxviii致谢xxxix1信息图形化第一印象在为手头数据无法给出事情真相而发愁吗?统计能化繁为简,帮助你让一堆堆令人困惑的数据发挥作用。当你发现数据的真相后,接下来就需要借助可视化的方法表现出来,使之公之于众。为了找到最合适的图表完成这个过程,TOC\o"1-5"\h\z请你整理衣衫,带上最好的计算尺,和我们一起赶往“统计邦 ”吧。统计量无处不在 2为何学习统计学?3从两张图说起 4呆板的饼图 8条形图更具精确性 10垂直条形图 10水平条形图 11标度的影响力 12使用频数标度 13处理多批数据 14类别与数字 18处理分组数据 19绘制直方图起步:求出长方形宽度 20第1步:求长方形宽度 26第2步:求长方形高度 27第3步:画出直方图28认识累积频数 34绘制累积频数图 35选择正确的图形 392集中趋势的量度中庸之道有时候,把握问题核心才是当务之急。从一大堆数字中看出模式和趋势可能颇为不易,而求出平均数往往是把握全局的第一步。有了平均数就能迅速找出数据中最具代表性的数值,得出重要结论。在本章中,我们将介绍几种方法,帮助你计算最重要的统计量 —均值、中位数、众数。你将开始学习如何有效地汇总数据,尽可能得出简练、有用的结果。欢迎来到健身俱乐部46TOC\o"1-5"\h\z均值:平均数的一般量度 47均值数学 48处理未知条件49再说均值 50再说健身俱乐部 53人人都在练功夫 54我们的数据中存在异常值 57真凶是异常值 58饮水机边的对话 60寻找中位数 61求中位数三步法:62生意日益兴隆 65小鸭呱呱游泳班 66均值和中位数出了什么问题?69我们该怎么处理这样的数据呢?69TOC\o"1-5"\h\z均值访谈 71认识众数 73求众数三步法 743分散性与变异性的量度强大的“距”世事可靠不可靠,我们该问谁?平均数在寻找数据集典型值方面十分了得,但平均数并不能说明一切。平均数能让你知道数据中心所在,但若要给数据下结论,仅有均值、中位数和众数往往无法提供充足信息。在本章中,我们将开始分析各种距和差,让你的数据分析技术进入新境界。招聘:队员一名84TOC\o"1-5"\h\z我们需要比较球员得分 85使用全距区分数据集 86异常值带来的问题 89我们需要摆脱异常值 91四分位数出手相救 92四分位距剔除异常值 93剖析四分位数 94我们并不局限于使用四分位数 98什么是百分位数?99用箱线图绘制各种“距”100TOC\o"1-5"\h\z变异性比分散性更具体 104计算平均距离 105我们可以用方差计算变异性……106但标准差才是更直观的量度方法107标准差访谈 108方差速算法 113碰上需要比较基准的情况该怎么办?118使用标准分比较不同数据集中的数值 119标准分释义 120统计邦全明星篮球队赢了联赛!1254概率计算把握机会人生无常瞬息之间的变化有时难以一一料定。但有些事情会比其他事情更有可能发生,这就为概率理论提供了大显身手的舞台。通过概率能评估出现各种结果的可能性,让你预测未来。知悉可能出现的结果则可帮助你作出有根据的决策。本章将让你了解更多概率知识,学会如何掌控未来!肥蛋大满贯 128转起来吧,轮盘!129几率有多大?132TOC\o"1-5"\h\z求解轮盘概率 135维恩图:概率的图形表示 136你还可以将几个概率相加 142互斥事件与相交事件 147交集带来的问题148更多表示法 149又一次倒霉的转动……155设定条件156求解条件概率 157利用概率树还能计算条件概率 159概率树使用诀窍161第1步:求P(黑n偶)167第2步:求P(偶)169第3步:求P(黑|偶)170利用全概率公式求解 P(B)172TOC\o"1-5"\h\z认识贝叶斯定理 173如果几个事件互有影响,则为相关事件 181如果几个事件互不影响,则为独立事件 182再谈独立事件概率计算 1835离散概率分布的运用善用期望意外从天而降,未来如何演变?前文讲到如何通过概率得知发生某些事件的可能性的大小。可惜概率并非万能,它无法指出所发生的这些事情的整体影响,也无法指出这种整体影响对你的具体影响。不错,你有时会在轮盘赌中大赚特赚,但你赚到的钱真的填得平那些赔掉的钱吗?在本章中,我们将讲述如何利用概率预测长期结果,以及如何量度这些预测结果的确定性。重回肥蛋赌场198TOC\o"1-5"\h\z我们可以写出老虎机概率分布 201期望指示预测结果……204方差指示结果的分散性205方差和概率分布 206让我们算算老虎机的方差207肥蛋改了价码 212E(X)WE(Y^间存在线性关系217老虎机变换 218线性变换的通用公式219每一次拉杆为一个独立观测值 222观测值速算法223新老虎机在等你229E(X)+E(Y)E(X+Y)230E(X)-E(Y)=E(X-Y)231线性变换也可以做加减运算 232发了!2386排列与组合排序、排位、排顺序有时很重要一清点某些事物的所有可能排序方法耗时颇巨,可这却是计算某些概率必不可少的过程一麻烦就在这里。在本章中,我们将介绍推导出这类信息的简便方法,为你免除清点一切可能结果的烦恼。来吧,让我们看看如何计算概率。TOC\o"1-5"\h\z统计邦德比杯马赛 242三马赛正在进行 243马儿们有几种穿越终点线的方式?245计算排位数目 246圆形排位247花样赛开始了 251按个体排名与按种类排名不是一回事 252我们需要按种类排列动物253推导出用于重复排列的公式254二十马赛正在进行 257前三甲归属方式有几种?258何为排列259假如马匹排名无关紧要 260何为组合 261组合访谈 262比赛结束 2687几何分布、二项分布及泊松分布坚持离散计算概率分布颇为费时。前面讲到如何计算和利用概率分布,不过,如果方法更简单一些,计算速度更快一些,效果岂不更好?在本章中,我们将介绍一些特殊的概率分布,这些概率分布有着十分固定的模式。只要懂得这些模式并善加利用,就能以前所未有的速度计算概率、期望、方差。接着读吧,让我们一起来认识几何分布、二项分布及泊松分布。TOC\o"1-5"\h\z我们需要求出查德的概率分布 273这种概率分布有一种固定模式 274概率分布可以用代数式表示 277几何分布对不等式同样有用 279几何分布的期望模式280期望是1/p281求当前分布的方差 283几何分布简明指南 284转椅赢赢赢!287你已经掌握了几何分布 287玩下去,还是转身走?291TOC\o"1-5"\h\z推广到求3个问题的概率 293进一步推导概率算式296期望和方差如何计算? 298二项分布的期望与方差 301二项分布简明指南 302泊松分布的期望和方差 308概率分布是怎样的?312组合泊松变量313伪装下的泊松分布 316泊松分布简明指南 3198正态分布的运用保持正态离散概率分布并非无所不能。到目前为止,我们接触到的都是可以指定确切数值的概率分布。然而并非所有数据集合都是如此,还有几类数据并不符合我们之前遇到的概率分布。我们将在这一章里讲解所谓的连续型概率分布,并介绍最重要的概率分布类型之一 —正态分布。离散数据可取确切值……326但并非所有数值型数据都是离散的327推迟几分钟?328我们需要求连续数据的概率分布 329TOC\o"1-5"\h\z概率密度函数可用于描述连续数据 330概率=面积 331欲算概率,先求f(x)……332再求面积,可得概率 333概率算好了337寻找灵魂伴侣338男伴模型339正态分布是连续数据的“理想”模型340如何求正态概率?341TOC\o"1-5"\h\z正态概率计算三步法 342第1步:确定分布 343第2步:标准化为 N(0,1)344欲完成标准化,先移动均值……345然后收窄345现在,为要计算其概率的特定数值求出 Z346第3步:用方便易用的概率表查找概率 3499再谈正态分布的运用超越正态但愿所有的概率分布都是正态分布。有了正态分布,日子好过多了—既能一口气查出整个范围的概率,又能留下点时间玩游戏,谁还会花时间一个一个地计算概率呢?在本章中,你将学习如何闪电般解决更复杂的问题,还将懂得如何将正态分布的便利运用到其他概率分布上。TOC\o"1-5"\h\z双双登上爱情过山车 363正态新娘 +正态新郎 364终究还是体重问题365综合体重符合哪种分布?367求解概率370更多人想坐爱情过山车 375线性变换描述了数据的基本变化……376而独立观察结果描述的是你有多少数值 377独立观察结果的期望和方差378接着玩,还是转身走?383正态分布出手相救 386何时用正态分布近似代替二项分布 389再谈正态近似 394395二项分布是离散分布,正态分布则是连续分布395在计算近似值之前先进行连续性修正396组合访谈404大家坐上爱情过山车 405何时用正态分布近似代替泊松分布 407婚礼成功!41310统计抽样的运用抽取样本统计需要处理数据,数据从何而来?有时候数据很容易收集 —例如参加一家健身俱乐部的人员的年龄,或一家游戏公司的销售数据;但有时候不太容易,这时候该怎么办?—当事件数量十分庞大时,很难决定该从何处着手收集数据。在本章中,我们将看看如何在实际工作中成功收集数据 —有效地、正确地、省时省钱地收集数据。欢迎来到抽样天地。TOC\o"1-5"\h\z曼帝糖果公司口味检验 416糖球吃光了417对糖球样本而非糖球总体进行检验 418抽样方法419当抽样有误时 420如何设计样本 422确定抽样空间 423样本有时会发生偏倚 424偏倚的来源 425如何选择样本 430简单随机抽样 430如何选取简单随机样本 431其他类型的抽样 432我们可以用分层抽样……432或可用整群抽样433或可用整群抽样或甚至可用系统抽样 433曼帝糖果公司有了样本 43911总体和样本的估计进行预测得样本而知总体,不亦乐乎?若想成为样本专家,首先要懂得如何最有效地利用到手的样本 —利用样本准确地预测总体,并以一定方式说明预测结果的可靠程度。在本章中,我们将讲解如何通过样本了解总体,以及如何通过总体了解样本。糖球口味到底能持续多久?442TOC\o"1-5"\h\z让我们首先估计总体均值 443点估计量可以近似总体参数 444让我们估计总体方差448我们需要一个有别于样本方差的点估计量 449哪个公式用在哪里?451这是一个比例问题454这和抽样有什么关系?459比例的抽样分布 460Ps的期望是多少? 462Ps的方差是多少? 463求解Ps的分布464TOC\o"1-5"\h\zPs符合正态分布 465我们需要求样本均值的概率 471均值的抽样分布 472求X的期望474X的方差是多少?476X如何分布? 480当n很大时, X仍然可以用正态分布近似 481使用中心极限定理 48212置信区间的构建自信地猜测有时候样本无法给出足够正确的结果。前面讲到如何用点估计量估计总体均值、方差或一定比例的精确值。问题在于,你怎么能肯定自己的估计完全正确?毕竟,你仅仅依靠一个样本对总体作出假设,如果这个样本出问题怎么办?本章将介绍另一种估计总体统计量的方法 —一种考虑了不确定性的方法。拿出你的概率表,我们将向你讲解置信区间的来龙去脉。TOC\o"1-5"\h\z曼帝糖果出事了 488精度引起的问题 489认识置信区间490求解置信区间四步骤491第1步:选择总体统计量 492第2步:求出所选统计量的抽样分布 492第3步:决定置信水平 494第4步:求出置信上下限 496先求Z497用m改写不等式 498最后求X的数值501你求出了置信区间 502步骤总结503置信区间简便算法 504第1步:选择总体统计量 508第2步:求X的概率分布 509第3步:决定置信水平 512第4步:求出置信上下限 513t分布与正态分布比较 51513假设检验的运用研究证据他人的言论未必句句真实可信。问题是如何判断他人的言论何时真,何时假?假设检验为你提供了一种方法—利用样本检验各种统计断言是否可能属实。通过假设检验可以权衡证据,检验极限结果 —是纯属巧合,还是存在其他内在根据?让我们一起阅读本章,看看如何利用假设检验证实或打消你内心深处的疑虑。统计邦新上市的神奇药品522纵观全局526假设检验六步骤527TOC\o"1-5"\h\z第1步:确定假设 528第2步:选择检验统计量 531第3步:确定拒绝域 532第4步:求出p值535第5步:样本结果位于拒绝域中吗?537第6步:作出决策 537如果样本增大会怎么样?540让我们再进行一次假设检验 543第1步:确定假设 543第2步:选择检验统计量 544547在我们的检验统计中用正态分布近似二项分布547第3步:求出拒绝域 548让我们从第一类错误讲起 556再谈第二类错误 557发现鼾克检验的错误 558我们需要求数值范围 559求P(第二类错误)560认识功效56114x2分布继续探讨……有时候事实与期望并不相符。当以一种特定的概率分布为某种情况建模时,对于事物的长期可能结果,你有十分清晰的想法。可如果期望与事实存在差别呢?你该如何判断?—这些偏差是正常波动,还是说明概率模型存在问题?本章将讲解如何利用2分布分析结果,排除可疑结果。TOC\o"1-5"\h\z肥蛋赌场可能有麻烦 568让我们从老虎机开始 569用x2检验评估差异 571检验统计量代表什么?572x2分布的两个主要用途 573表示自由度 574显著性是多少?575x2假设检验 576你解开了老虎机之谜 579肥蛋遇到了新问题585x2分布可以检验独立性 586可用概率求出期望频数 587频数是多少?588我们还需要计算自由度 591自由度计算方法归纳596得出算式597得出算式你救了肥蛋赌场59915相关与回归我的线条如何?你是否曾经为某两件事的相互关系困惑不已?前面讲过的统计量只描述一个变量—如个人身高、篮球队员得分或是糖球口味持续时间,但是,另外还有一些统计量可以说明变量之间的关系。了解事物的相互关系可以丰富你的信息,让你了解真相,使你立于不败之地。来吧,让我们为你介绍发现事物关系的秘诀:相关与回归。TOC\o"1-5"\h\z让我们分析天晴时数和听众人数 607数据类型探讨 608二变量数据可视化 609散点图为你指出模式 612相关关系与因果关系 614用最佳拟合线预测数值 618最佳猜测仍

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论