应用2-统计量的计算和箱线图_第1页
应用2-统计量的计算和箱线图_第2页
应用2-统计量的计算和箱线图_第3页
应用2-统计量的计算和箱线图_第4页
应用2-统计量的计算和箱线图_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语言研究中的统计学(Ⅱ)2009年3月山西大学数学科学学院1语言研究中的统计学基本统计量语言研究中的统计学2山西大学数学科学学院统计量集中趋势量平均数中位数众数离中趋势量极差四分差平均差标准差方差(一)平均数(样本均值)语言研究中的统计学3山西大学数学科学学院1、算术平均根据频数分布表

根据分组频数分布表

2、加权平均加权平均数例子语言研究中的统计学4山西大学数学科学学院例1有3个班,人数分别为20、30和40,在某次考试中的平均成绩分别为85,75,80,那么这三个班的加权总平均成绩为:例2综合测评成绩的计算:注意:权大小的确定要有一定的依据。特别地:如果所有权的和为1,则称为标准权。(二)中位数语言研究中的统计学5山西大学数学科学学院顺序样本中间位置的数,即样本容量(总次数)N的50%位置的数。1、对未分组数据求中位数2、根据分组频数分布表求中位数或L—中位数所在组下限U—中位数所在组上限fL—L以下各组总次数fU—U以上各组总次数F—中数所在组次数i—中数所在组组距

(三)众数语言研究中的统计学6山西大学数学科学学院一组数据中出现次数最多的数值注意:1、如组中各数都相同,则没有众数;2、也可能出现两个以上的众数;3、称含有两个众数的次数分布为双众数分布。求法:从顺序样本中找,样本容量大的,先做频数统计表。平均数、中位数和众数的关系7皮尔逊经验公式(P40)众数=3*中位数-2*平均数山西大学数学科学学院语言研究中的统计学平均数、中位数和众数的比较语言研究中的统计学8山西大学数学科学学院1、灵敏度平均数的计算涉及到每个样本值,所以对数值的变化比较敏感。2、稳定性对同一总体而言,均值比较稳定,受抽样影响较小。3、信息量平均数既反映了数值的顺序关系,又体现了所有样本的值,同时又稳定,所以它所提供的信息量最大。4、运算平均数适合代数运算,且比较简单。平均数、中位数和众数的比较语言研究中的统计学9山西大学数学科学学院6、极端值样本中过大或过小的数值称为极值平均值不能体现极端值的信息,从而不能很好地反映分布的信息,有时中数和众数更好一点。7、数据分布对于对称分布,三数非常接近,特别是正态分布时三数相等;对偏态分布,三数差异较大,一般地:正偏或右偏时,众数<中位数<平均数

负偏或左偏时,平均数<中位数<众数平均数、中位数和众数的比较语言研究中的统计学10山西大学数学科学学院三数各有优缺点,平均数用得比较多。正态分布,三数相同正偏或右偏众数<中位数<平均数负偏或左偏平均数<中位数<众数语言研究中的统计学11山西大学数学科学学院(四)极差极差又称两极差,是样本值中最大值和最小值之间的差。XmaxQ1Q2Q3Xmin两极差25%25%语言研究中的统计学12山西大学数学科学学院(五)四分差定义:分组数据四分点的求法:语言研究中的统计学13山西大学数学科学学院(六)(绝对)平均差(AD)定义:分组数据平均差的求法:注意到:所以我们需要取绝对值。其中称右式为离均差:语言研究中的统计学14山西大学数学科学学院(七)方差与标准差未分组数据:变形一变形二由次数分布表来求更简单一些。略语言研究中的统计学15山西大学数学科学学院(七)方差与标准差(续)由分组次数分布表:式中:f为组频数;d为各组数据的假定平均离均差,其中Xc为各组组中值,A为估计平均值。N为总次数,i为组距。A的确定:取总次数一半的累积次数所对应的那一组的组中值,因为它更接近真正的平均值。语言研究中的统计学16山西大学数学科学学院离中趋势量的比较极差可以在一定程度上反映数据的差异情况,为数据分组提供依据;四分差比两级差稳定可靠,常与中位数结合使用;平均差优于两级差和四分差,用数值离开平均值的平均距离来反映数据的离散程度,但不适合微分运算;方差和标准差是最理想的差异量:概念易于理解,适合代数运算和微分运算,能反映所有数据的差异情况,不易受抽样的影响。一个分数在一组分数中的位置是参照该组分数的典型分数来确定的,也就是说,一个分数可以描述为在典型分之上还是之下或者是等于典型分,以及它离开典型分有多远。这个典型分数用平均分表示,离开典型分的距离用标准差表示,这样我们就可以是“某个分数离开平均分多少个标准差单位”,同时用正负号表示该分数处于平均分之上还是之下。这实际上就是把原始分数转换为标准差单位数,或以标准差为单位来表示一个分数与平均数的差,此过程称为标准化过程语言研究中的统计学17山西大学数学科学学院标准化语言研究中的统计学18山西大学数学科学学院标准分一个分数离开平均分的“标准差单位数”称为标准分或Z分,常用Z表示。标准分的性质:一组分数的标准分的和为零,即;一组分数的标准分之平均值为0,即;一组分数的标准分之标准差为1,即;标准分具有对称性。标准分的应用:比较不同质(不同分布)的分数;将不同质的多个分数合成后再比较。语言研究中的统计学19山西大学数学科学学院标准分与百分位对照表标准分百分位标准分百分位标准分百分位标准分百分位-2.3312.3399-1.645-0.52300.52701.5495-1.2810-0.39350.39651.2890-1.0415-0.25400.25601.0485-0.8420-0.13450.13550.8480-0.67250500.6775五数概括与箱线图20对有序样本,容易计算以下五个值(五数):最小观测值Xmin;最大观测值Xmax;中位数m0.5=Q2;第一个四分位数Q1=m0.25;第三个四分位数Q3=m0.75;箱线图(Boxplot),又称箱须图(Box-whiskerPlot)、盒形图、箱图、盒子图。作法如下:画一个箱子,其两侧恰为第一4分位数和第三4分位数,在中位数位置画一条竖线。这个箱子包含了50%的数据。在箱子左右两侧各引一条水平线,分别至最小值和最大值,每条线段包含25%的数据。山西大学数学科学学院语言研究中的统计学箱线图21箱线图可以对样本数据的分布形状进行大致的判断。山西大学数学科学学院语言研究中的统计学箱线图22箱线图可以对样本数据的分布形状进行大致的判断。例:以下是100个英语句子的长度。山西大学数学科学学院语言研究中的统计学610131517192124294481113161719212434448111316171922253547812141617192226364891214161820222637489121416182022263950912141618202326405191215161820232740551012151718202328405610131517192124294458练习23山西大学数学科学学院语言研究中的统计学CaseProcessingSummaryCasesValidMissingTotalNPercentNPercentNPercentV1100100.0%0.0%100100.0%练习24山西大学数学科学学院语言研究中的统计学DescriptivesStatisticStd.ErrorV1Mean22.371.22995%ConfidenceIntervalforMeanLowerBound19.93UpperBound24.815%TrimmedMean21.42Median19.00Variance150.943Std.Deviation12.286Minimum6Maximum58Range52InterquartileRange12Skewness1.246.241Kurtosis.791.478练习25山西大学数学科学学院语言研究中的统计学PercentilesPercentiles5102550759095WeightedAverage(Definition1)V19.0010.0014.0019.0026.0044.0049.90Tukey'sHingesV114.0019.0026.00直方图26山西大学数学科学学院语言研究中的统计学Stem-and-Leaf

Plots27山西大学数学科学学院语言研究中的统计学V1

Stem-and-Leaf

Plot

Frequency

Stem

&

Leaf

8.00

0

.

68889999

19.00

1

.

0001122222233334444

27.00

1

.

555566666667777778888899999

18.00

2

.

000001112222333444

9.00

2

.

566667899

1.00

3

.

4

4.00

3

.

5679

6.00

4

.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论