版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关键术语统计学(Statistics)收收集、分析、表述和解释数据的艺术和科学。数据(Data)收被收集、分析和解释的事实与数字。(Dataset个体(Elements)从中收集数据的实体。变量(Variable)个体的某种令人感兴趣的属性。观测值(Observation)为单个个体获取的度量集。(Qualitativedata值或数值型的。品质变量(Qualitativevariable)有关品质数据的变量。(Quantitative(Quantitative截面数据(Cross-sectionaldata)在同时或近似相同时点收集的数据。时间序列数据(Timeseriesdata)在几个连续期间收集的数据。描述统计学(Descriptivestatistics)用于汇总数据的表、图和数值方法。总体(Population)一特定研究中所有感兴趣个体的集合。样本(Sample)总体的一个子集。(Statistical检验的过程。(Frequencydistribution)一组的项目频数(或个数)。相对频数分布(Relativefrequencydistribution)一数据集的表格汇总法,显示在若干无重叠组别中每一组的项目总数的相对频数,即分数或比例。(Percentfrequencydistribution)重叠组别中每一组的项目总数的百分率。条形图(Bargraph)一种图形方法,描述在品质数据的频数分布、相对频数据分布或百分数频数分布中表示的信息。(Piechart)相对频数相对应的扇型的基础上。(Histogram)数分布、相对频数分布或百分数频数分布。累积频数分布(Cumulativefrequencydistribution)对数量数据集的表格法汇总,显示数值小于或等于每一组组上限的项目数。(Cumulativerelativefrequencydistribution)汇总,显示数值小于或等于每一组组上限的项目分数或比例。累积百分数频数分布(Cumulativepercentfrequencydistribution)对数量数据的表格法汇总,显示数值小于或等于每一组组上限的项目的百分率。组中值(Classmidpoint)每一组中在组下限和组上限正中间的值。(Stem-and-leafdisplay)息的探索性数据分析技术。(Crosstabulation)另一变量的组用列来描述。(Scatterdiagram)另一个变量列在纵轴上。(Populationparameter)用来概括总体数据的量度的数值(方差2,总体标准差)。(Samplestatistic)用来概括样本数据的量度的数值(差。平均数(Mean)衡量数据集中心位置的量度。用所有数据值相加的和除以项数计算。中位数(Median)衡量数据集中心位置的量度。中位数的值将所有的数据分为两个相等部分,一部分的值都大于或等于它,而另一部分的值都小于或等于它。众数(Mode)用以衡量数据的位置的量度,定义为发生频数最高的数据值。百分位数(Percentile)至少有p%的数据项小于等于这个值,且至少有(100-p)%的数据项大于等于这个值。第50百分位数即为中位数。四分位数(Quartiles)第25、第50和第75百分位数分别即为第1、第2、第3四分位数。四分位数将数据集分为4个部分,每一部分含有25%的数据。临界点(Hinges)下端临界点约等于第2四分75(Range)用以衡量变异程度的量度,定义为最大值减最小值的差。四分位点内距(Interquartilerange,IQR)用以衡量变异程度的量度,定义为第3四分位数与第1个四分位数之差。方差(Variance)用以衡量数据集变异程度的量度,是建立在距平均数离差的平方值的基础上的。(Standarddeviation)用以衡量数据集变异程度的量度,取方差的正的平方根。标准差系数(Coefficientofvariation)100得到。Z分数(Z-score)以距平均数的离差除以标准差s所得的值。Z分数是标准化的数值,指数据值xi距离平均数的标准差的个数。切贝谢夫定理(Chebysher’stheorem)这一定理可以用于任何数据集,用来描述与平均数的距离在特定数目个标准差范围之内的数据项的百分比。(Empiricalrule)这一法则适用于ft个、3个标准差范围之内的数据项的百分比。异常值(outlier)异常大或异常小的数据值。(Five-numbersummary)第13四分位数和最大值来概括数据集。(Boxplot)和第50%的数据。以一条横线(称为须线)四分位数的数据值的位置。所有异常值的位置也予以标明。协方差(Covariance)用以衡量两变量间线性相关关系的数值量度。正值表示正相关,负值表示负相关。(Correlationcofficient从-到+。接近+的值表示强的正线性相关,接近-的值表示强的负线性相关,接近零的值表示几乎无线性相关关系。加权平均数(Weightedmean)度。由此获得的平均数即为加权平均数。(Groupeddata)值。概率(probability)衡衡量某一事件发生可能性的数值量度。试验(Experient)衡任何可以产生明确定义的结果的过程。试验结果用符号Ei表示。样本点(Samplepoint)衡单一的试验结果。样本空间(Samplespace)衡所有可能的样本点(试验结果)的集合。树形图(Treediagram)衡一种用于多步骤试验样本点的定义的辅助图形工具。(Basicrequirementsof条件:。个试验结果满足。(Classical(Relativefrequencymethod(Subjective事件(Event)衡一个样本点的集合。事件的补(Complementofevent的样本点构成的事件。文氏图(Venndiagram事件A和事件B的并(UnionofAandB)衡所有的属于A或B或同时属于二者的样本点构成的事件。A和B的并记作A∪B。事件A和事件B的交(IntersectionofAandB)衡同时属于A和B的样本点构成的事件。A和B的交记作A∩B。(Addition0∪B)=P(A)+P(B)。互斥事件(Mutuallyexclusiveevents)衡两个事件没有公共的样本点;即A∩B为空且P(A∩B)=0。(Conditional下|。(Independentevents有也就是说,事件间相互没有影响。(Multiplication的概率公式。可以写成PP(A∩B)=P(A)P(B)。先验概率(Priorprobabilities)衡事件的初始估计概率。后验概率(Posteriorprobabilities)衡根据另外的信息而得到的事件的修正概率。贝叶斯定理(Baye’stheorem)衡一种用来计算后验概率的方法。随机变量(Randomvariable)试试验结果的数值性描述。(Discreterandom(Continuousrandomvariable)试可取一个区间或一系列区间的任何值的随机变量。(Probabilitydistribution述。概率函数(Probabilityfunction)试一个函数,用f(x)标记,提供了离散型随机变量x取特定值的概率。(Discreteuniformprobability离散型概率分布的函数。数学期望(Expectedvalue)试度量随机变量平均值或中心位置的量度。方差(Variance)试度量随机变量的差异性,或离散性的量度。标准差(Standarddeviation)试方差的正平方根。二项试验(Binomialexperment)试具有5.4节中4个属性的概率试验。(Binomialprobability的概率分布。二项概率函数(Binomialprobabilityfunction)试用来计算二项试验的概率的函数。泊松概率分布(Poissonprobabilitydistribution)试表示在一段特定时间或空间中一个事件发生x次的概率的概率分布。泊松概率函数(Poissonprobabilityfunction)试用来计算泊松概率的函数。超几何概率函数(Hypergeometricprobability次成功的概率的函数。均匀概率分布(Uniformprobabilitydistribution)一一种连续型概率分布,其随机变量在等长度的每一区间上取值的概率都相同。(Probabilitydensity(NormalProbability标准正态概率分布(Standardnormalprobabilitydistribution)均值为0、标准差为1的正态分布。连续修正因子(Continuitycorrectionfactor)一当用连续正态概率分布来近似离散二项概率分布时,从x值加减的0.5值。指数概率分布(Exponentialprobabilitydistribution)一一种连续型概率分布,在计算一个事件两次发生之间的时间或空间的概率时有用参数(Parameter)总体的一个数值特征,如总体均值、总体标准差、总体比率p等等。简单随机抽样(Simplerandomsampling)有限总体:选择一个样本,n个样本点中每一个等概率被选到。无限总体:选取的样本,其中每一个元素来自同一总体并且是独立的。(Samplingwithoutreplacement)不能再次被选入。放回抽样(Samplingwithreplacement)一个元素一旦选入样本,仍被放回总体中。先前被选入的元素可能再次被选,并且在样本中可出现多次(多于一次)。(SampleStatistic)等。样本统计量用于估计总体的参数值。(Samplingdistribution)(Pointestimate)点估计量(Pointestimator)提供总体参数点估计的样本统计量,如:、s或。(Finitepopulationcorrectionfactor)对自有限总体而非无限总体抽n.0时,一般可忽略有限总体修正系数。标准误差(Standarderror)点估计量的标准差。中心极限定理(CentralLimittheorem)当样本容量大的时候,用正态概率分布近似和的抽样分布。(Unbiasedness)(Relativeefficiency)(Consistency)接近。分层简单随机抽样(Stratifiedsimplerandomsampling)一种概率抽样方式,总体先分成层,然后从每层中抽取简单随机样本。(Clustersampling)多个群。(Systematicsampling)k个元素中随机选一个,然后依次往后选第k个元素。(Coveniencesampling)(Judgementsampling)一种非概率抽样方式,其中基于研究人员的判断选择元素为样本。(Intervalestimate)内。(Samplingerror)无偏估计值(如样本均值)与所估计的总体参数值(率|-|-。精度(Precision)抽样误差的概率解释。(ConfidenceLevel)95%的置信水平。其中,0.95称作置信系数。边际误差(Marginerror)置信区间中从点估计值中所加上或减去的值。t分布(tDistribution)概率分布的一族,当总体是正态或者近似正态概率分布,并且总体标准差未知的情况下,对总体均值进行区间估计时常用到该分布。自由度(Degreesoffreedom)t分布的参数,计算总体均值的区间估计中所用到的t分布的自由度为n-1,其中n是简单随机样本的样本容量。原假设(Nullhypothesis)在假设检验的程序中,最初假定为真的假设。(Alternativehypothesis)第一类错误(TypeIerror)当时所发生的错误。第二类错误(TypeIIerror)当H0为假却接受了H0时所发生的错误。临界值(Criticalvalue)与检验统计量相比,用于确定是否拒绝H0的值。显著性水平(Levelofsignificance)所允许的发生第一类错误的最大概率值。(Onetailedtest)拒绝原假设。双边检验(Two-tail
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年企业品牌形象设计与推广服务合同
- 2024年云计算服务出口合同涉及的税务条款
- 2024年个人电商大件货物运输合同
- 2024年5G网络技术研发许可合同
- 2024年保险代理合同(含保险产品列表)
- 砂石料设备维护保障方案
- 幼儿园国庆节小小讲解员活动方案
- 钢结构安装现场管理方案
- 桥梁施工中应急预案方案
- 2024年西藏客运从业资格证考试题库模拟考试答案
- 社团组织结构图
- 2023年超星《军事理论》考试题库(通用题型)
- 2023年学习兴税(纳税服务条线)知识考试题库(含答案)
- 《花样年华》的美学分析
- 山东省济南市历下区2023-2024学年八年级上学期期中语文试题
- 图神经网络在生物医学影像分析中的应用
- 浅谈管理者的自我管理
- 第一章 结构及其设计 课件-2023-2024学年高中通用技术苏教版(2019)必修《技术与设计2》
- 语文教学常规检查表
- 幼儿园中班语言:《两只蚊子吹牛皮》 课件
- “思政”课社会实践
评论
0/150
提交评论