2025年新高考数学复习压轴题讲义:概率与统计下的新定义(五大题型)_第1页
2025年新高考数学复习压轴题讲义:概率与统计下的新定义(五大题型)_第2页
2025年新高考数学复习压轴题讲义:概率与统计下的新定义(五大题型)_第3页
2025年新高考数学复习压轴题讲义:概率与统计下的新定义(五大题型)_第4页
2025年新高考数学复习压轴题讲义:概率与统计下的新定义(五大题型)_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题03概率与统计下的新定义

【题型归纳目录】

题型一:二项式定理新定义

题型二:排列组合新定义

题型三:概率新定义

题型四:统计方法新定义

题型五:信息端问题

【方法技巧与总结】

解概率与统计下的新定义题,就是要细读定义关键词,理解本质特征,适时转化为“熟悉”问题.总

之,解决此类问题,取决于己有知识、技能、数学思想的掌握和基本活动经验的积累,还需要不断的实践

和反思,不然就谈不上“自然”的、完整的解题.

【典型例题】

题型一:二项式定理新定义

【典例1-1】(2024•湖南衡阳•二模)莫比乌斯函数在数论中有着广泛的应用.所有大于1的正整数”都可以

被唯一表示为有限个质数的乘积形式:九=可席…优(左为”的质因数个数,P,为质数,

=例如:90=2X32X5>对应1=3,R=2,%=3,2=5,==1,2=2,,=1.现对任意

l,n=l

〃eN*,定义莫比乌斯函数〃⑺=<(一球,4=4=,,,=〃=1

0,存在01

⑴求〃(78),〃075);

(2)若正整数%〉互质,证明:〃(孙)=〃(耳〃(耳;

⑶若〃>1且〃(〃)=1,记〃的所有真因数(除了1和"以外的因数)依次为如出,…,4”,证明:

〃(《)+〃(出)+…+〃(%)=—2•

【解析】(1)因为78=2x3x13,易知左=3,0=2,p2=3,p3=13,z;=1,^=1,^=1,

所以〃(78)=(—1)3=—1;

又375=3x53,因为5的指数3>1,所以〃(375)=0;

⑵①若x=l或。=1,因为〃⑴=1,所以〃(孙)=

②若尤,ywi,且存在质数。,使得x或y的质因数分解中包含//(厂>1),则w的质因数分解中一定也包含

p',

所以〃(孙)==°,

③若羽ywl,且不存在②中的P,可设x=“02…=…%,

其中P1,P2…口1,4"%…%均为质数,则»=P|P?…040…4,

因为尤,y互质,所以Pi,p『5""%…p互不相等,

所以M孙)=(一1户=(T>(T)'=〃(*)〃(y),

综上可知M盯)=〃(力〃3

(3)由于〃(")=1,所以可设“="。2…P”k为偶数,

”的所有因数,除了1之外都是R,P2,…,"中的若干个数的乘积,从%个质数中任选《,=1,2,…,女)个数的

乘积一共有C;种结果,

所以〃⑴+〃(%)+4(%)+…+4(4)+〃(〃)

=〃(l)+[〃(Pl)+〃(〃)+…+〃(〃)]+[〃(。1。2)+〃(。2。3)+…+〃(PlPj]+…+〃(〃)

=I+C1(T)+C(T)2+…+优(一1广+(一以=(1一1)*=。,

所以…=O_"(l)_M(n)=—2.

【典例1-2】(2024.安徽合肥・一模)“4-数”在量子代数研究中发挥了重要作用.设q是非零实数,对任意

〃cN*,定义“4-数”(叽=1+4++/T利用“4-数”可定义“4-阶乘"("/二⑴涅山(初,且(0儿=1.和

“4—组合数”,即对任意上eN,附eN*,kW力

⑴计算:

(2)证明:对于任意左,〃wN*,左+1«〃,

n+m+l\(〃\C

⑶证明:对于任意%,加£N,〃6N*,左+1<〃,

【解析】(1)由定义可知,

[5)=⑸!2⑴2⑵2⑶式4)2(5)2

【31一(3)!2(2)C[(1)2(2)2(3)2][(1)2(2)2]

_(4)式5)2_(1+2+22+23乂1+2+22+23+2,).⑶

⑴2⑵21X0+2))

(矶5)/(1/

(左)!“〃一女儿[k}\q{n-k)\q

n-1n-1n八5

+qk♦q+•q

k-1k传T)!“〃_女儿。儿("%T儿

qq

=(小

kklknkx

又(k)q+q\n-k)q=l+q++q~+q(\+q++q~~)

=l+q++/i=(心

所以m+1

(3)由定义得:

对任意keN,weN*,后

结合(2)可知

n+m+1n+m\n+m-kn+m

所以

z+1k+1k

qqq

n+m

\Jn+m-\\=,_Jn+m-1

k+1k

k+1[I)qI

上述加+i个等式两边分别相加得:

([n+%m+1+l\(n「孕工’Ink+i:\

【变式1-1](2024•高三.江苏苏州•阶段练习)甲、乙、丙三人以正四棱锥和正三棱柱为研究对象,设棱长为

”,若甲从其中一个底面边长和高都为2的正四棱锥的5个顶点中随机选取3个点构成三角形,定义随机变

量X的值为其三角形的面积;若乙从正四棱锥(和甲研究的四棱锥一样)的8条棱中任取2条,定义随机变量

4的值为这两条棱的夹角大小(弧度制);若丙从正三棱柱的9条棱中任取2条,定义随机变量”的值为这两

条棱的夹角大小(弧度制).

(1)比较三种随机变量的数学期望大小;(参考数据

arctan^5«0.3661,arctan«0.2677,arctan2^2«0.3918)

(2)现单独研究棱长",记(x+l)x(x+gjx+且〃eN*),其展开式中含x项的系数为S“,含

f项的系数为T”.

①若*a/+b"+c,对"=2,3,4成立,求实数b,c的值;

②对①中的实数。,b,c用数字归纳法证明:对任意〃22且“eN*,3=M2+加+。都成立.

【解析】(1)如图所示:

由题意设。/为正四棱锥。-ABCE的高,G为A3中点,

由于正四棱锥的底面边长和高都是2,

所以AC=BE=2&,£>B=2,所以=

由对称性以及三线合一可知DG=后斤=V5,

若甲从其中一个底面边长和高都为2的正四棱锥的5个顶点中随机选取3个点构成三角形,

则X的所有可能取值为]x2x2=2,x2x岔=6,x2&x2=2近,

222

且P(X=2)="=|,尸(X=2码=,.中=&)=卷=|,

所以个)=(>2+“应+|x如=4+22+2占>4+2X;+2X2=2,

若乙从正四棱锥(和甲研究的四棱锥一样)的8条棱中任取2条,

则4的所有可能取值为"I,。,arctan君,arctan]g,arctan272,

厂/八714c22

E<)=—x-----i-Ox-----1-arctan一+arctan2^2x

v7228282828

代入参考数据arctan#i®0.3661,arctanX0.2677,arctan2V2«0.3918,得1.0890,

M

若丙从正三棱柱的9条棱中任取2条,

则力的所有可能取值为1TT*TT0,

兀187112c613KY……

矶〃)=—x-----1——x-----FOX——=——«1.1345

2363363636

所以E(X)>矶叼〉E©.

(2)①因为(x+l)x[x+g]xx[x+)]中x项的系数为S",

一般地,从(x+l)x(x+;卜x[x+:]中的第七个因式中取一个x,其余因式中取常数即可得到一个x

项,

知在k1+2++nn(n+1)

而这一项的系数为一;,S=---------------=———-)

n\nn\2-nl

因为(尤+l)x(x+g)x+中f项的系数为T“,

一般地,从(x+l)x[x+g]xx[x+:]中的第个因式中各取一个x,其余因式中取常数即可得到

一个/项,

,,]

而这一项的系数为之,从而Eij,

n\^\<i<j<n

2x333x44x55

从而S==1,S4=

22x2!22x3!2x4!"12?

旦1X2+1X3+2X3JIx2+lx3+lx4+2x3+2x4+3x435

22!33!644!"24

4a+2b+c=—=—

S23

由题意中+3"W解得“4,八-5c=J

16a+4b+c=—=—

邑2

—T,3ra2-n-2+Z

②用数学归纳法证明:“22且〃eN*时,-^=an2+bn+c=---=~卷——

7^__j__2_

--

当〃=2时,s233-4126,故结论对〃=2成立,

2

假设结论对n=k22,keN*成立,即今=合炉=(1譬+2),

、k1/iz

k\Tk/x

几I+_%!看+信+1)(1+2++%)_人工+化+1"!&_听+1+)

IJI11=----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

加优+1)!加(左+1)!%45+优+1)1+A±1

黑+化+1)--1)"+2)+%+1

k+i-_

i+---------------i+—

1+2+…+左k

_("0(3左+2)+12左+12_3/+11)+10_信+2乂3左+5)

[(A+1)-1工3(左+1)+2]

12

所以结论对〃=左+1也成立,

故?=。〃2+bw+c=^---------------,对任意"22,”eN”成立.

S.12

题型二:排列组合新定义

【典例2-1】(2024.高三.北京.阶段练习)设"为正整数,集合A={a|a=外,*{01},左=1,2,,n.

对于集合A中的任意元素£=(玉,々,…,%)和分=定义

1(%月)=|%一乂|+卜一对++\xn-yn\-

⑴当”=4时,若以=(0,1,0,1),若=(1,1,0,1),直接写出所有使d(a,7)=2,d(Q,7)=3同时成立的A的元素

⑵当〃=3时,设3是A的子集,且满足:对于3中的任意两个不同元素a,回北%夕)22.求集合3中元素

个数的最大值;

⑶给定不小于2的“,设8是A的子集,且满足:对于3中的任意两个不同的元素以£,〃(0,022,写出

一个集合8,使其元素个数最多,并说明理由.

【解析】⑴•.«=(0,l,0,l),J(a,y)=2

•••满足条件的/有

a0101

Y0000

ye{(0,0,0,。),(0,0,1,1),(0,1,1,0)}(2)列出集合4的元素

000

001

010

011

100

101

110

111

B是A的子集,且满足:对于B中的任意两个不同元素a,p,d(a,£巨2

满足条件的集合8的元素的个数的最大值为4.

001

010

100

111

(3).d(a,夕巨2

•••8中的元素应该含有奇数个1

若"=2,则含有奇数个1的元素有C;=2个;

若n=3,则含有奇数个1的元素有1+优=4个;

若n=4,则含有奇数个1的元素有《+优=8个;

若"=5,则含有奇数个1的元素有《+《+隽=16个;

当〃=3时,B={(0,0,1),(0,1,0),(1,0,0),(1,1,1))

【典例2-2】(2024・高三・浙江・开学考试)一般地,〃元有序实数对(%,%,,、耳)称为“维向量.对于两个〃维

向量。=(4,出,,%),6=(4也,也),定义:两点间距离d=J(4-aJ?+色一的J+…+(X-%利用

“维向量的运算可以解决许多统计学问题.其中,依据“距离”分类是一种常用的分类方法:计算向量与每个

标准点的距离4,,与哪个标准点的距离4最近就归为哪类.某公司对应聘员工的不同方面能力进行测试,

得到业务能力分值(卬)、管理能力分值(%)、计算机能力分值(%)、沟通能力分值(%)(分值

%eN*,^e{l,2,3,4}代表要求度,l分最低,5分最高)并形成测试报告.不同岗位的具体要求见下表:

业务能力分值管理能力分值计算机能力分值沟通能力分值合计分

岗位

(4)(%)3)(%)值

会计⑴215412

业务员

523515

后勤⑶235313

管理员

454417

(4)

对应聘者的能力报告进行四维距离计算,可得到其最适合的岗位.设四种能力分值分别对应四维向量

"=的四个坐标.

(1)将这四个岗位合计分值从小到大排列得到一组数据,直接写出这组数据的第三四分位数;

(2)小刚与小明到该公司应聘,已知:只有四个岗位的拟合距离的平方力均小于20的应聘者才能被招录.

⑴小刚测试报告上的四种能力分值为4=(4,3,2,5),将这组数据看成四维向量中的一个点,将四种职业

123、4的分值要求看成样本点,分析小刚最适合哪个岗位;

(ii)小明已经被该公司招录,其测试报告经公司计算得到四种职业1、2、3、4的推荐率(0分别为

而14石13石9‘热7(?"行"试d2求小明]的各项能力分信

【解析】⑴将四个岗位合计分值从小到大排列得到数据12,13,15,17,

又,="0=4x0.75=3,所以这组数据的第三四分位数为号2=16.

(2)⑴由图表知,会计岗位的样本点为4=(2』,5,4),则叶=(2-4)2+(1-3)2+(5-2)2+(4-5)2=18,

业务员岗位的样本点为分=(5,2,3,5),则d;=(5-4>+(2-3>+(3-2)2+(5-5)2=3,

后勤岗位的样本点为凤=(2,3,5,3),则d;=(2-4>+(3-3>+(5-2f+(3-=17,

管理员岗位的样本点为力,=(4,5,4,4),则/=(4-4)2+(5-3)2+(4-2>+(4-5)2=9,

所以&<&<&<4,故小刚最适合业务员岗位.

⑪四种职业1234的推荐率⑺分别为m,。且。"力+小〜厂

力14

14T幺+++

d;+d;+d;+d:43-

43

d;_1341332逍4

=一I+++

+d;++d;4343

9

所以■j2,得到

一d&

dl9-+++

d;+d;+d;+d:4343

7

4T成d2*

d;_7-++3+

d;+d;+d;+d;4343

又d:(ne{1,2,3,4})均小于20,所以#+召+存+或<80,且/eN*(海{1,2,3,4}),

故可得到片=14,以=13,据=9,或=7,

设小明业务能力分值、管理能力分值、计算机能力分值、沟通能力分值分别为a,》,Gd,且a,b,c,deN*,

l<a,b,c.d<5,

依题有(〃-2)2+(b—I)?+(c-5)2+(d-4)2=d;=14①,

(a-5)2+(b-2)2+(c-3)2+(d-5)2=dl=13(2),

(a-2y+S-3y+(c-5y+(d-3>=d;=9③,

(a—4/+S—5)2+(c—4/+(d—4)2=d:=7④,

由①一③得,

(a-2)2+(Z?-1)2+(c-5)2+(rf-4)2-[(a-2)2+(b-3)2+(c-5)2+(^-3)2]=14-9=5,

整理得:2b—d=3,

b=2,d=l

故有<0=3,d=3三组正整数解,

b=4,d=5

对于第一组解,代入④式有(a-4)2+9+(c-4)2+9=7,不成立;

对于第二组解,代入①式有(。-2)2+(c-5)2=4,

缶=4[a—1

解得「或。,代入②④式均不成立;

[c=51c=3

对于第三组解,代入②式有5-5)2+(c-3)2=9,

4=2

\a=1…………b=4

解得,,代入①②③④均成立,故,;

[c=3c=3

d=5

故小明业务能力分值、管理能力分值、计算机能力分值、沟通能力分值分别为2,4,3,5.

题型三:概率新定义

【典例3-1】(2024・浙江・一模)混管病毒检测是应对单管病毒检测效率低下的问题,出现的一个创新病毒检

测策略,混管检测结果为阴性,则参与该混管检测的所有人均为阴性,混管检测结果为阳性,则参与该混

管检测的人中至少有一人为阳性.假设一组样本有N个人,每个人患病毒的概率相互独立且均为

目前,我们采用K人混管病毒检测,定义成本函数/(Xjut+XX,这里X指该组样本N

个人中患病毒的人数.

⑴证明:E[〃X)]Z2JF.N;

(2)若OvpvlOr104KW20.证明:某混管检测结果为阳性,则参与该混管检测的人中大概率恰有一人

为阳性.

【解析】⑴由题意可得X满足二项分布XB(N,p),

由E(aX+6)=aE(X)+。知,E\_f(X)l=—+K-E(X)=—+K-pN>2^-N,当且仅当,=&时取等

KKK

号;

(2)记A=p(混管中恰有1例阳性|混管检测结果为阳性),

4=p(混管中恰有i例阳性尸C,KP’(1一p广,i=0,1,,K,

令/z(x)=e-_2/]0-3<彳<2乂]0-3,

则=

当xe(-2xl(F3,0)时,/z(x)为单调递减,

当xe(0,2x10-3)时,〃")>o,为单调递增,所以〃(x)N〃(O)=O,

2xlo-3-32xl-3

且〃(-2x10-3)=e--(-2xlO^-l-O,/z(2xl0)=e°-(2x10^)-1~0,

所以当—2xl(f3<x<2xl(f3,e,-尤—IBO即e,~x+l,两边取自然对数可得%句110+1),

所以当0<P<1()Y,10WKV20时,

所以(1_?>=6.。切®e7Kp®1—Kp,

4_"(1-广&[1-伍一1)同

贝”=

i-]-(1-域Kp

故某混管检测结果为阳性,则参与该混管检测的人中大概率恰有一人为阳性.

【典例3-2】(2024•辽宁・模拟预测)条件概率与条件期望是现代概率体系中的重要概念.近年来,随着人们对

随机现象的不断观察和研究,条件概率和条件期望已经被广泛的利用到日常生产生活中.定义:设X,Y是

离散型随机变量,则X在给定事件丫=》条件下的期望为

P(X=x^Y=y}(、

E(XW=y)=,P(X=尤/y=y)=>再■l',其中{4%,…,当}为X的所有可能取值集合,

i=li=lrv-y)

p(X=x,y=y)表示事件“x=x”与事件“Y=y”都发生的概率.某射击手进行射击训练,每次射击击中目

标的概率均为p(0<〃<l),射击进行到击中目标两次时停止.设J表示第一次击中目标时的射击次数,"表

示第二次击中目标时的射击次数.

⑴求尸仁=2,〃=5),尸(〃=5);

(2)求E(的=5),22).

【解析】(1)由题设,P值=2,〃=5)=(1—。>,(1一。>(1—。)/=(1一。)3/,

尸何=5)=C(1一。只/=纵1一pFp2.

(2)由题设,夙目〃=5)=1[%><?(J=x,,〃=5)

i=l尸(〃=5)

P(〃=5)4442

同(1),PS=n)=2P2=(n_1)(1_pr-2p2,P(Ji〃=")=(i_pyTp2,

x

3尸(《,〃=〃)12n-25T厂l+D

所以项目"")?印〉P(L)^^+百+…+”产

22

【变式3-1](2024.福建漳州.一模)在数字通信中,信号是由数字。和1组成的序列,发送每个信号数字之间

相互独立.由于随机因素的干扰,发送的信号0或1有可能被错误地接收为1或0.

⑴记发送信号变量为x,接收信号变量为「且满足P(X=O)=;,p(y=i|x=o)=|,

p(y=0|X=l)=|,求尸(y=0);

an

(2)当发送信号0时,接收为0的概率为J,定义随机变量7的“有效值”为“(〃)=-=x,)lgP(〃=x;)

4z=i

(其中天是〃的所有可能的取值,,=1,2,…发送信号“000”的接收信号为“%力%”,记4为%,%,%

三个数字之和,求4的“有效值”.(1g3«0.48,1g2«0.30)

i2

【解析】⑴由题意可知:p(x=i)=i-p(x=0)=-,p(y=oix=o)=i-p(y=i|x=o)=-,

所以尸(y=o)=尸(y=0|X=0)尸(x=o)+尸(y=0|X=l)尸(X=l)=gx:+;x;=H

(2)由题意可知:当发送信号0时,接收为0的概率为3:,接收为1的概率为1:,

44

可知:4的可能取值有0,1,2,3,

则尸("°)=03=葛尸(9)=叫

…心盗[吟吟3)二审$,

—小片山—+〃/八(27、2727.279.9

'/16464646464646464)

54QA-|45

=——(31g3-61g2)+—(21g3-61g2)-—1g2=——-Ig3+61g2

_o4o4o4Jlo

45

«——x0.48+6x0.30=0.45,

16

即J的“有效值”约为0.45.

题型四:统计方法新定义

【典例4-1](2024•全国・模拟预测)某校20名学生的数学成绩%0=1,2,.,,20)和知识竞赛成绩%。=1,2,,20)

如下表:

学生编号i12345678910

数学成绩W100999693908885838077

知识竞赛成绩B29016022020065709010060270

学生编号i11121314151617181920

数学成绩X,75747270686660503935

知识竞赛成绩%4535405025302015105

20

计算可得数学成绩的平均值是元=75,知识竞赛成绩的平均值是9=90,并且元)丁6464

Z=1

2020

£(X-J)2=149450,£(x,.-x)(y,-y)=21650.

上1Z=1

(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到0.01).

(2)设NeN*,变量x和变量丁的一组样本数据为{(%,»)1,=1,2,,,N},其中x,(i=l,2,,N)两两不相同,

%(i=l,2,,N)两两不相同.记尤,在卜|“=1,2,,N}中的排名是第4位,%在旧旧=1,2,,N}中的排

名是第S,位,1=1,2,,N.定义变量x和变量y的“斯皮尔曼相关系数,,(记为夕)为变量x的排名和变量y的

排名的样本相关系数.

6N

⑴记4=4f,i=i,2,,N.证明:N(N?一余与.

(ii)用⑴的公式求这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”(精确到0。1).

(3)比较(1)和(2)(ii)的计算结果,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.

ZU-元n

i=ln(n+l)(2n+l)

注:参考公式与参考数据.;ILK=;76464x149450»31000.

£(^-^)2£(x-y)2k=l6

/=1Z=1

【解析】(1)

由题意,这组学生数学成绩和知识竞赛成绩的样本相关系数为

20

Z&-元)(y-9)

2165021650…

i=l«--------«0.70

2020

£(x..-x)2£(x-y)276464x1495031000

i=li=l

(2)⑴证明:因为{4}和{Sj都是1,2,LN的一个排列,所以

fN44Ns,.=N(N+1)

Z=1Z=12

NNN(N+1)(2N+1)

=£s;=

1=11=16

N+l

从而{«}和{S}的平均数都是R=S=2

NQNNNN2N(N+1)(2N+1)N(N+1yN(N+1)(N-1)

因此,f(K-R)=£&-2应史=^R;-NR

i=lZ=1«=1Z=16412

N_

2N(N+1)(N-1)

同理可得E(s,-«y=

Z=112

NcN

NNcR,_R)_(S「用2

由于fd;本(R「s)-==2(兄-R)+2(E-s可-2t(6-Q(s,「子)

1=1Z=1Z=1i=\«=1

N

一2±(4一用母一目,

12i=l

NWV+IXN-l)」0

-司(E-于)

126lNx;

i=l2日—i_

所以夕二=(

N(N+1)(N—1)NN2-1)Z=1

12

(ii)由题目数据,可写出与与S,的值如下:

同学编号i12345678910

数学成绩排名%12345678910

知识竞赛成绩排名S/p>

同学编号i11121314151617181920

数学成绩排名&11121314151617181920

知识竞赛成绩排名S,12141311161517181920

N

所以N=20,并且£力=9xO2+4xl2+3x22+2x32+lx42+lx82=114.

i=l

因此这组学生的数学成绩和知识竞赛成绩的斯皮尔曼相关系数是

p=\——7—-~~X114~O.91

20(202-1)7

(3)答案①:斯皮尔曼相关系数对于异常值不太敏感,如果数据中有明显的异常值,那么用斯皮尔曼相关系

数比用样本相关系数更能刻画某种线性关系;

答案②:斯皮尔曼相关系数刻画的是样本数据排名的样本相关系数,与具体的数值无关,只与排名有

关.如果一组数据有异常值,但排名依然符合一定的线性关系,则可以采用斯皮尔曼相关系数刻画线性关

系.

【典例4-2】(2024•全国•模拟预测)冰雪运动是深受学生喜爱的一项户外运动,为了研究性别与学生是否喜

爱冰雪运动之间的关系,从某高校男、女生中各随机抽取100名进行问卷调查,得到如下列联表

(m<40,/7/eN).

喜爱不喜爱

男生80-m20+m

女生60+m40-m

(1)当相=0时,从样本中不喜爱冰雪运动的学生中,按性别采用分层抽样的方法抽取6人,再从这6人中

随机抽取3人调研不喜爱的原因,记这3人中女生的人数为求4的分布列与数学期望.

(2淀义/=Z(%一%)(2ViV3,2V其中%为列联表中第i行第,列的实际数据,如

%

为列联表中第i行与第•;列的总频率之积再乘以列联表的总额数得到的理论频数,如4.2=8。­",

功,2=黑乂黑x200=70.基于小概率值a的检验规则:首先提出零假设变量X,F相互独立),然后

计算六的值,当K?、五时,我们推断“0不成立,即认为X和y不独立,该推断犯错误的概率不超过a;

否则,我们没有充分证据推断“。不成立,可以认为X和y独立.根据K2的计算公式,求解下面问题:

①当机=0时,依据小概率值1=0.005的独立性检验,分析性别与是否喜爱冰雪运动有关?

②当机<10时,依据小概率值&=0.1的独立性检验,若认为性别与是否喜爱冰雪运动有关,则至少有多少

名男生喜爱冰雪运动?

附:

a0.10.0250.005

Xa2.7065.0247.879

【解析】(1)当m=0时,用分层抽样的方法抽取的不喜爱冰雪运动的6人中,男生有2人,女生有4人,

由题意可知,J的可能取值为1,2,3.

「2cl3

2信=1)=罟.1,%=2)=罟=|3,P(1)=罟c°C1

(2)①零假设为H。:性别与是否喜爱冰雪运动独立,即性别与是否喜爱冰雪运动无关联.

当m=0时,42=80,B22=70,43=20,B23=0.5x0.3x200=30,

A32=60,B32=0.5x0.7x200=70,A33=40,B33=0.5x0.3x200=30,

(4,2一区2,2)+(4,3-82,3)+(4,2-员,2)+(&3-四,3)

K2=

°2,243员2B33

22

(80—70)2(20—30)2(60-70)(40-30)200八…

=-----x9.524•

70-3070-3021

9.524>7.879=x0005,

,根据小概率值。=0.005的独立性检验,我们推断“。不成立,即认为性别与是否喜爱冰雪运动有关联,

此推断犯错误的概率不超过0.005.

②如_(80一机―70『+.(J+机—30)2+(60+机一70)2+(40-m-30)2_2(10-m)2

'—70307030—21

由题意可知,>2,706,整理得(10-帆)2228.413.

又m<10,m<4,加的最大值为4.

X80-4=76,,至少有76名男生喜爱冰雪运动.

【变式3(2024.高三北京.期末)在测试中‘客观题难度的计算公式为月吟,其中为第i题的难度,

(2)从抽样的20名学生中随机抽取2名学生,记这2名学生中第5题答对的人数为X,求X的分布列和数

学期望;

⑶定义统计量5=匕(尸;-6)2+(只-£)2++(尸;-月,沟,其中P'为第i题的实测难度,耳为第i题的预估难度

n1

。=1,2,,〃).规定:若S<Q05,则称该次测试的难度预估合理,否则为不合理.判断本次测试的难度预

估是否合理.

【解析】(1)因为20人中答对第5题的人数为4人,因此第5题的实测难度为4=0.2,

所以估计240人中有240x0.2=48人实测答对第5题.

(2)X的可能取值是0,1,2.

C1C132C23

p(X=l)=^A=2_.P(X=2)=W=3

C;o9595

⑶第1题的实测难度为*0.8,同理可得:第2题的实测难度为*0.8,

1414

第3题的实测难度为三二0.7,第4题的实测难度为三二0.7,第5题的实测难度为0.2,

故S=J(0.8-0.9)2+(0.8-0.8)2+(0.7-0.7)2+(0.7-0.6)2+(0.2-0.4)2]=0,012.

因为5=0.012<0.05,

所以,该次测试的难度预估是合理的.

题型五:信息燧问题

【典例5-1】(2024.高三.河北•阶段练习)信息燧是信息论之父香农(S/2G"[o〃)定义的一个重要概念,香农在

1948年发表的论文《通信的数学理论》中指出,任何信息都存在冗余,把信息中排除了冗余后的平均信息

量称为“信息蜡”,并给出了计算信息嫡的数学表达式:设随机变量X所有可能的取值为1,2,,n(neN*),

且尸(X=i)=p,>0(』,2,-,*£p,=1,定义X的信息嫡H(X)=-J>JogzP,.

i=li=l

(1)当”=1时,计算a(x);

⑵若口J(i=l,2,.判断并证明当〃增大时,"(X)的变化趋势;

n

(3)若"=2〃M"[eN*),随机变量¥所有可能的取值为1,2.加,且尸(¥=/)=0+。2,=1,2,,m),证

明:H(x)>H(r).

【解析】⑴当〃=1时,则i=l,R=l,所以〃(X)=_(lxlog21)=0

⑵”(X)随着"的增大而增大.

当口=1,2,㈤,则H(X)=-(L]og2qx〃=_k>g2,=log2",

n\nnJn

设/⑺=log2〃,〃£N*,则/(n+l)-/(n)=log2(n+l)-log2n=log2^l>0,

n

因此a(X)随着n的增大而增大.

(3)证明:若九=2m(meN*),随机变量y所有可能的取值为1,2,,根,且

P(y=力=Pj+P2m+l-jU=1,2,,m).

2m2mi

“(X)=-£p,•1唯Pi=£P,」题2—

z=li=lPi

i1i1i1i1

+

=Pl.l°g2—+夕2.l°g2—++P2fn-1•l°g2----P21n,---.

PlPlPlm-XPim

]

HK

()=(A+P2nl).l°g2---+(0+必m-1).l°g2---------++(P"+Pm+i>bg2

+

A+PirnP”P2mTP,nPm+1

因为0<P,+P2,“+iT<l(i=l,2m),故l°g2丁一---->0

Pi十Plm+l-i

故H(y)>P「l°g2---+。2.10g2---------+-+必m-1.l°g2---------+Pzjlogz-'—

Pl+P2,nPl+Plm-lPl+Plm-XP/Pl"

/、11八

由于p,,0(i=l,2,,2m),所以一>二------>0,

PiPi+Plm+\-i

,1,1,11

所以l°g2—>logo----------,所以P,Tog?一〉p,•log?----------,

++

PiPiP2,n+l-iPiPiPlm+X-i

所以刀(x)>H(y).

【典例5-2】(2024・高三•河北•期末)在信息论中,崎(entropy)是接收的每条消息中包含的信息的平均量,又

被称为信息燧、信源嫡、平均自信息量.这里,“消息”代表来自分布或数据流中的事件、样本或特征.(嫡最好理

解为不确定性的量度而不是确定性的量度,因为越随机的信源

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论