2025年新高考数学压轴题讲义:概率与统计下的新定义(五大题型)(学生版)_第1页
2025年新高考数学压轴题讲义:概率与统计下的新定义(五大题型)(学生版)_第2页
2025年新高考数学压轴题讲义:概率与统计下的新定义(五大题型)(学生版)_第3页
2025年新高考数学压轴题讲义:概率与统计下的新定义(五大题型)(学生版)_第4页
2025年新高考数学压轴题讲义:概率与统计下的新定义(五大题型)(学生版)_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题03概率与统计下的新定义

【题型归纳目录】

题型一:二项式定理新定义

题型二:排列组合新定义

题型三:概率新定义

题型四:统计方法新定义

题型五:信息墙问题

【方法技巧与总结】

解概率与统计下的新定义题,就是要细读定义关键词,理解本质特征,适时转化为“熟悉”问题.总之,

解决此类问题,取决于已有知识、技能、数学思想的掌握和基本活动经验的积累,还需要不断的实践和反

思,不然就谈不上“自然”的、完整的解题.

【典型例题】

题型一:二项式定理新定义

【典例1-1】(2024•湖南衡阳・二模)莫比乌斯函数在数论中有着广泛的应用.所有大于1的正整数〃都可以被

唯一表示为有限个质数的乘积形式:〃=…P?"为"的质因数个数,P,为质数,々21/=1,2,…,左),

例如:90=2x32x5>对应后=3,==2,必=3,A=5,4=1,々=2,4=1.现对任意〃eN*,定义莫比乌斯函数

\,n—\

〃(〃)=<(-1)<力=&=.••=〃=1

0,存在乙>1

⑴求〃(78),〃(375);

(2)若正整数X,/互质,证明:〃(孙)=〃(x)〃(y);

⑶若且〃(〃)=1,记〃的所有真因数(除了1和”以外的因数)依次为可,出,…,缁,证明:

〃(4)+〃(%)+…+〃(%,)=-2.

【典例1-2](2024・安徽合肥・一模)“q~数”在量子代数研究中发挥了重要作用.设是非零实数,对任意〃eN*,

定义“4-数”(叽=1+q+…+q-1利用“q~数”可定义“q~阶乘”⑺!产0)52%…(心,且⑼!=1.和“4-组合

(ri'}(n)'

数”,即对任意上eN,〃eN*,《W”,,

IQ(叽("一后儿

5

⑴计算:

2

(2)证明:对于任意左,〃eN*,左+14〃

(3)证明:对于任意上eN,”eN*,左+14〃,

【变式1-11(2024・高三•江苏苏州•阶段练习)甲、乙、丙三人以正四棱锥和正三棱柱为研究对象,设棱长为〃,

若甲从其中一个底面边长和高都为2的正四棱锥的5个顶点中随机选取3个点构成三角形,定义随机变量X

的值为其三角形的面积;若乙从正四棱锥(和甲研究的四棱锥一样)的8条棱中任取2条,定义随机变量J的

值为这两条棱的夹角大小(弧度制);若丙从正三棱柱的9条棱中任取2条,定义随机变量”的值为这两条棱

的夹角大小(弧度制).

(1)比较三种随机变量的数学期望大小;(参考数据

/1—\

arctanV5«0.3661,arctan——x0.2677,arctanx0.398)

I2J

(2)现单独研究棱长〃,记(x+l)x[x+g]x…+且〃eN*),其展开式中含x项的系数为S.,含产

项的系数为4.

①若?=病+加+。,对〃=2,3,4成立,求实数。,b,c的值;

②对①中的实数。,b,。用数字归纳法证明:对任意〃22且〃eN*,?=病+加+。都成立.

题型二:排列组合新定义

【典例2-1】(2024・高三・北京•阶段练习)设"为正整数,集合/={a|a=(4,小…工,)},4e{0,1},笈=1,2,.

对于集合A中的任意元素a=(占/2,…,x“)和/?=(/,%,•••/“),定义

d[a,P)=\xi-y^+\x2-y^+---+\xn-yn\.

⑴当〃=4时,若a=(0,1,0,1),皆=(1,1,0,1),直接写出所有使d(a,7)=2,d(/,7)=3同时成立的A的元素7;

⑵当〃=3时,设B是A的子集,且满足:对于3中的任意两个不同元素a,/7,d(c,0W2.求集合B中元素个

数的最大值;

⑶给定不小于2的〃,设&是A的子集,且满足:对于B中的任意两个不同的元素a,/7,♦(G,£)22,写出

一个集合8,使其元素个数最多,并说明理由.

【典例2-2](2024・高三・浙江・开学考试)一般地,〃元有序实数对(为,出,…,%)称为〃维向量.对于两个〃维向

量3=(°],%,-、%),3=3也「一也),定义:两点间距离d=J(4_+(4_/)+…+("_aJ'利用"维

向量的运算可以解决许多统计学问题.其中,依据“距离”分类是一种常用的分类方法:计算向量与每个标准

点的距离或,与哪个标准点的距离口最近就归为哪类.某公司对应聘员工的不同方面能力进行测试,得到业

务能力分值(%)、管理能力分值(电)、计算机能力分值(%)、沟通能力分值(%)(分值%€?0€{1,2,3,4}代表

要求度,1分最低,5分最高)并形成测试报告.不同岗位的具体要求见下表:

业务能力分值管理能力分值计算机能力分值沟通能力分值合计分

冈t-Lj位

(%)(。2)(«3)(«4)值

会计⑴215412

业务员

523515

(2)

后勤(3)235313

管理员

454417

(4)

对应聘者的能力报告进行四维距离计算,可得到其最适合的岗位.设四种能力分值分别对应四维向量

£=(弓,°2,。3,。4)的四个坐标.

(1)将这四个岗位合计分值从小到大排列得到一组数据,直接写出这组数据的第三四分位数;

(2)小刚与小明到该公司应聘,己知:只有四个岗位的拟合距离的平方屏均小于20的应聘者才能被招录.

⑴小刚测试报告上的四种能力分值为瓦=(4,3,2,5),将这组数据看成四维向量中的一个点,将四种职业

1、2、3、4的分值要求看成样本点,分析小刚最适合哪个岗位;

(ii)小明已经被该公司招录,其测试报告经公司计算得到四种职业1、2、3、4的推荐率(p)分别为

14^3_9_2_f_d:、

43543543J43^"-d;+d;+d;+%试求小明的各项能力分值.

题型三:概率新定义

【典例3-1](2024・浙江・一模)混管病毒检测是应对单管病毒检测效率低下的问题,出现的一个创新病毒检测

策略,混管检测结果为阴性,则参与该混管检测的所有人均为阴性,混管检测结果为阳性,则参与该混管

检测的人中至少有一人为阳性.假设一组样本有N个人,每个人患病毒的概率相互独立且均为

P(O<P<1).目前,我们采用K人混管病毒检测,定义成本函数/(X)=§+XX,这里X指该组样本N个

人中患病毒的人数.

⑴证明:£[/(X)]>2^-2V;

(2)若OvpvlCT4,10WK420.证明:某混管检测结果为阳性,则参与该混管检测的人中大概率恰有一人

为阳性.

【典例3-2】(2024•辽宁・模拟预测)条件概率与条件期望是现代概率体系中的重要概念.近年来,随着人们对

随机现象的不断观察和研究,条件概率和条件期望已经被广泛的利用到日常生产生活中.定义:设X,丫是离

散型随机变量,则X在给定事件丫=了条件下的期望为

=y)=比x「p(x=x,.|r=j)=*,其中{x15x2,•••,%„}为x的所有可能取值集合,

Z=1Z=1

尸(x==力表示事件“x=x”与事件“丫=》”都发生的概率.某射击手进行射击训练,每次射击击中目标

的概率均为p(0<p<l),射击进行到击中目标两次时停止.设j表示第一次击中目标时的射击次数,〃表示第

二次击中目标时的射击次数.

(1)求尸(J=2,〃=5),尸(〃=5);

(2)求£©〃=5),£©〃=矶〃22).

【变式3-1](2024•福建漳州•一模)在数字通信中,信号是由数字0和1组成的序列,发送每个信号数字之间

相互独立.由于随机因素的干扰,发送的信号0或1有可能被错误地接收为1或0.

⑴记发送信号变量为X,接收信号变量为y,且满足P(x=o)=;,尸(y=i|x=o)=g,尸(y=0|x=i)=:,

求/。=o);

(2)当发送信号0时,接收为0的概率为1,定义随机变量〃的“有效值"为'=xJ座(〃=碧)(其

4z=i

中乙是〃的所有可能的取值,:1,2,…,〃),发送信号“000”的接收信号为“弘%%”,记4为乂,%,%三个

数字之和,求J的“有效值(1g3no.48,1g2Mo.30)

题型四:统计方法新定义

【典例4-1](2024・全国•模拟预测)某校20名学生的数学成绩x,(i=1,2,…,20)和知识竞赛成绩乂(i=1,2,…,20)

如下表:

学生编号i12345678910

数学成绩X,100999693908885838077

知识竞赛成绩%29016022020065709010060270

学生编号i11121314151617181920

数学成绩X,75747270686660503935

知识竞赛成绩力4535405025302015105

20

计算可得数学成绩的平均值是方=75,知识竞赛成绩的平均值是歹=90,并且-可-=6464,

z=l

2020

£5-7)=149450,£伍-可(%-力=21650.

z=li=l

(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到0.01).

⑵设NeN*,变量无和变量》的一组样本数据为{(即片)Ii=1,2,…,N},其中七(i=1,2,…,N)两两不相同,

%(i=L2,…,N)两两不相同.记若在{x,|〃=l,2,…,N}中的排名是第4位,%在{%|〃=1,2,…,N}中的排名

是第S,位,i=l,2,…,N.定义变量x和变量V的“斯皮尔曼相关系数”(记为。)为变量x的排名和变量V的排

名的样本相关系数.

6N

⑴记4=K-Sj,,=1,2,…,N.证明:P=l-N(N之一个^片,

(ii)用⑴的公式求这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”(精确到0.01).

(3)比较(1)和(2)(ii)的计算结果,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.

n

V(x.-y]

汪:参考公式与参考数据.〃=I,一“=;»=-^——2-------;76464x149450«31000.

加门迂(yfI6

Vi=li=l

【典例4-21(2024・全国•模拟预测)冰雪运动是深受学生喜爱的一项户外运动,为了研究性别与学生是否喜爱

冰雪运动之间的关系,从某高校男、女生中各随机抽取100名进行问卷调查,得到如下列联表(加440,冽eN).

喜爱不喜爱

男生80-m20+加

女生60+冽40—m

(1)当〃?=0时,从样本中不喜爱冰雪运动的学生中,按性别采用分层抽样的方法抽取6人,再从这6人中随

机抽取3人调研不喜爱的原因,记这3人中女生的人数为求4的分布列与数学期望.

⑵定义K?=£(4厂纥1(2Vi<3,2VJ<3,Z,7'6N),其中4/为列联表中第i行第•/列的实际数据,处为

『Bu

列联表中第i行与第J列的总频率之积再乘以列联表的总额数得到的理论频数,如4口=80-%,

=1^x1^x200=70.基于小概率值a的检验规则:首先提出零假设〃。(变量X,/相互独立),然后

计算K2的值,当K22x“时,我们推断〃。不成立,即认为X和y不独立,该推断犯错误的概率不超过a;

否则,我们没有充分证据推断〃。不成立,可以认为x和y独立.根据K2的计算公式,求解下面问题:

①当机=0时,依据小概率值a=0.005的独立性检验,分析性别与是否喜爱冰雪运动有关?

②当机<10时,依据小概率值e=0.1的独立性检验,若认为性别与是否喜爱冰雪运动有关,则至少有多少

名男生喜爱冰雪运动?

附:

a0.10.0250.005

Xa2.7065.0247.879

【变式4-1](2024・高三・北京・期末)在测试中,客观题难度的计算公式为々=爷,其中£为第i题的难度,段

为答对该题的人数,N为参加测试的总人数.现对某校高三年级240名学生进行一次测试,共5道客观题.测

试前根据对学生的了解,预估了每道题的难度,如下表所示:

题号12345

考前预估难度E0.90.80.70.60.4

测试后,随机抽取了20名学生的答题数据进行统计,结果如下:

题号12345

实测答对人数161614144

(1)根据题中数据,估计这240名学生中第5题的实测答对人数;

(2)从抽样的20名学生中随机抽取2名学生,记这2名学生中第5题答对的人数为X,求X的分布列和数学

期望;

⑶定义统计量S」[(K-4)2+(周-5了+,.+©一耳沟,其中E为第i题的实测难度,月为第i题的预估难度

n1

(;1,2,…规定:若S<0.05,则称该次测试的难度预估合理,否则为不合理.判断本次测试的难度预估

是否合理.

题型五:信息埔问题

【典例5-1](2024•高三・河北•阶段练习)信息嫡是信息论之父香农(5桁仞0〃)定义的一个重要概念,香农在1948

年发表的论文《通信的数学理论》中指出,任何信息都存在冗余,把信息中排除了冗余后的平均信息量称

为“信息蜡”,并给出了计算信息燧的数学表达式:设随机变量X所有可能的取值为1,2,…,〃(〃eN*),且

P(X=i)=月>0("1,2,…p,=1,定义X的信息燧H(X)=p,log?A.

i=li=\

(1)当”=1时,计算”(X);

(2)若p,=L(i=l,2「、〃),判断并证明当〃增大时,H(X)的变化趋势;

n

(3)若"=2小("7€]\*),随机变量y所有可能的取值为1,2,…,加,且尸(¥=/)=夕/+。2“+1-/(/=1,2「-,加),证

明:

【典例5-2】(2024・高三・河北・期末)在信息论中,端(entropy)是接收的每条消息中包含的信息的平均量,又

被称为信息燃、信源焙、平均自信息量.这里,“消息”代表来自分布或数据流中的事件、样本或特征.(燧最好理

解为不确定性的量度而不是确定性的量度,因为越随机的信源的嫡越大)来自信源的另一个特征是样本的概

率分布.这里的想法是,比较不可能发生的事情,当它发生了,会提供更多的信息.由于一些其他的原因,把

信息(嫡)定义为概率分布的对数的相反数是有道理的.事件的概率分布和每个事件的信息量构成了一个随机

变量,这个随机变量的均值(即期望)就是这个分布产生的信息量的平均值(即熠).燧的单位通常为比特,但也

用Sh、nat、Hart计量,取决于定义用到对数的底.采用概率分布的对数作为信息的量度的原因是其可加性.

例如,投掷一次硬币提供了ISh的信息,而掷力次就为加位.更一般地,你需要用log?〃位来表示一个可以

取〃个值的变量.在1948年,克劳德•艾尔伍德•香农将热力学的嫡,引入到信息论,因此它又被称为香农滴.

而正是信息烯的发现,使得1871年由英国物理学家詹姆斯•麦克斯韦为了说明违反热力学第二定律的可能性

而设想的麦克斯韦妖理论被推翻.设随机变量4所有取值为1,2,…,力,定义J的信息嫡”(9=-£片1崎E,

i=l

(£々=1,/=1,2,•••,«).

z=l

(1)若〃=2,试探索J的信息幅关于耳的解析式,并求其最大值;

(2)若<=2=吩-罪+1=2只(斤=2,3,…,〃),求此时的信息燧.

【变式5-1](2024・安徽合肥・模拟预测)在一个典型的数字通信系统中,由信源发出携带着一定信息量的消息,

转换成适合在信道中传输的信号,通过信道传送到接收端.有干扰无记忆信道是实际应用中常见的信道,信

道中存在干扰,从而造成传输的信息失真.在有干扰无记忆信道中,信道输入和输出是两个取值占,々,…,与的

随机变量,分别记作X和八条件概率尸(Y=x/X=xJ,i,/=l,2,…,〃,描述了输入信号和输出信号之间统

计依赖关系,反映了信道的统计特性.随机变量X的平均信息量定义为:〃(')=-^>('=4)1。&=R

Z=1

当〃=2时,信道疑义度定义为

22

X)=_XZ0(X=,,log4¥=引x=@=_[p(X=%y=jq)log2°(丫=,X=x^

/=1>1

+P(X=x1,y=x2)log2/?(y=x2\X=xJ+P(X=X2,Y=xjlog2p(Y=再|x=%2)

+尸(x=4,y=9)k>g2y=司x

(i)设有一非均匀的骰子,若其任一面出现的概率与该面上的点数成正比,试求扔一次骰子向上的面出现的

点数X的平均信息量(1吗3。L59,10g25。2.32,10g27。2.81);

(2)设某信道的输入变量X与输出变量丫均取值0,1.满足:

尸(x=o)=o,p(y=i|x=o)=0(y=o|x=i)=p(o<o<i,o<p<i).试回答以下问题;

①求尸(y=o)的值;

②求该信道的信道疑义度”(Kx)的最大值.

【过关测试】

1.(2024•高三•全国•专题练习)定义:int(x)为不超过x的最大整数部分,如int(2.3)=2,int(-2.3)=-3.甲、

乙两个学生高二的6次数学测试成绩(测试时间为90分钟,满分100分)如下表所示:

高二成绩第1次考试第2次考试第3次考试第4次考试第5次考试第6次考试

甲687477848895

乙717582848694

进入高三后,由于改进了学习方法,甲、乙这两个学生的数学测试成绩预计有了大的提升.设甲或乙高二

的数学测试成绩为x,若10int(«)+x-[int(6)『W100,则甲或乙高三的数学测试成绩预计为

lOint(五)+1-^10int(V7)+x-[int(^)]2>100,则甲或乙高三的数学测试成绩预计为100.

(1)试预测:在将要进行的高三6次数学测试成绩(测试时间为90分钟,满分100分)中,甲、乙两个学生的

成绩(填入下列表格内);

高三成绩第1次考试第2次考试第3次考试第4次考试第5次考试第6次考试

(2)记高三任意一次数学测试成绩估计值为人规定:fe[84,90],记为转换分为3分;,e[91,95],记为转换

分为4分;te[96,100],记为转换分为5分.现从乙的6次数学测试成绩中任意抽取2次,求这2次成绩的

转换分之和为8分的概率.

2.(2024・全国・一模)正态分布与指数分布均是用于描述连续型随机变量的概率分布.对于一个给定的连续型

随机变量X,定义其累积分布函数为尸(x)=P(XWx).已知某系统由一个电源和并联的A,B,C三个元件

组成,在电源电压正常的情况下,至少一个元件正常工作才可保证系统正常运行,电源及各元件之间工作

相互独立.

⑴已知电源电压X(单位:V)服从正态分布阳40,4),且X的累积分布函数为尸(x),求尸(44)-尸(38);

(2)在数理统计中,指数分布常用于描述事件发生的时间间隔或等待时间.已知随机变量7(单位:天)表示某

0,z<0

高稳定性元件的使用寿命,且服从指数分布,其累积分布函数为G⑺=/>0.

(i)设证明:P(T>tl\T>t2)=P(T>t1-t2);

(ii)若第"天元件A发生故障,求第〃+1天系统正常运行的概率.

附:若随机变量y服从正态分布N(〃口2),贝<7)=0.6827,P(|y-〃|<2。)=0.9545,

P(|Y3b)=0.9973.

3.为考查一种新的治疗方案是否优于标准治疗方案,现从一批患者中随机抽取100名患者,均分为两组,

分别采用新治疗方案与标准治疗方案治疗,记其中采用新治疗方案与标准治疗方案治疗受益的患者数分别

为x和y.在治疗过程中,用指标/衡量患者是否受益:若〃-则认为指标/正常;若/>〃+。,

则认为指标/偏高;若/则认为指标/偏低.若治疗后患者的指标/正常,则认为患者受益于治疗

方案,否则认为患者未受益于治疗方案.根据历史数据,受益于标准治疗方案的患者比例为0.6.

⑴求E(y)和D(y);

(2)统计量是关于样本的函数,选取合适的统计量可以有效地反映样本信息.设采用新治疗方案治疗第i位的

1,%>〃+cr

患者治疗后指标/的值为七,i=l,2,…,50,定义函数:/(%,)=<0,]U-<T<xi<ju+a.

-1,&<

(i)简述以下统计量所反映的样本信息,并说明理由.

①/=|/(a)|+|/12)|+~+/to)|;

②3GJ+1]+/(")[/I?)+11+…+/toto-1].

"2,

(ii)为确定新的治疗方案是否优于标准治疗方案,请在(i)中的统计量中选择一个合适的统计量,并根据统

计量的取值作出统计决策.

4.(2024・高二・四川遂宁•期末)2020年新冠肺炎疫情期间,某区政府为了解本区居民对区政府防疫工作的满

意度,从本区居民中随机抽取若干居民进行评分(满分100分),根据调查数据制成如下表格和频率分布直方

图,已知评分在[80,100]的居民有600人.

满意度评分[40,60)[60,80)[80,90)[90,100)

满意度等级不满意基本满意满意非常满意

(1)求频率分布直方图中a的值及所调查的总人数;

(2)定义满意度指数〃=(满意程度的平均分)/100,若乙<0.8,则防疫工作需要进行大调整,否则不需要大

调整.根据所学知识判断该区防疫工作是否带要进行大调整?(同一组中的数据用该组区间的中点值为代表)

(3)为了解部分居民不满意的原因,从不满意的居民评分在[40,50),[50,60)中用分层抽样的方法抽取6名居

民,倾听他们的意见,并从6人中抽取2人担任防疫工作的监督员,求这2人中仅有一人对防疫工作的评

分在[40,50)内的概率.

5.(2024・高三・北京•阶段练习)设离散型随机变量X和/有相同的可能取值,它们的分布列分别为

P(X=ak)=xk,P(Y=ak)=yk,xk>0,yk>Q,左=1,2,…,凡才/=力斤=1.指标D(X||F)可用来刻画

k=lk=l

X和y的相似程度,其定义为。(Xlly)=t>/n连.设X〜3(",p),o<p<l.

*-=iyk

(1)若T〜求D(Xl|y);

(2)若〃=2,尸(丫=4一l)=g,左=1,2,3,求£>(XUr)的最小值;

(3)对任意与X有相同可能取值的随机变量y,证明:r>(xllr)>o,并指出取等号的充要条件

6.(2024・高三•河南・期末)某国家队要从男子短道速滑1500米的两名种子选手甲、乙中选派一人参加2022

年的北京冬季奥运会,他们近期六次训练成绩如下表:

次序(i)123456

甲(七秒)142140139138141140

乙(B秒)138142137139143141

(1)分别计算甲、乙两人这六次训练的平均成绩小,2,偏优均差备,乙;

(2)若|%-%|<2«=1,2,3,4,5,6),则称甲、乙这次训练的水平相当,现从这六次训练中随机抽取3次,求有

两次甲、乙水平相当的概率.

注:若数据网,X"中的最优数据为加,定义<=:[(玉-%)2+(%-〃?)2+—+(%-%)[为偏优均差.本题

中的最优数据即最短时间.

7.(2024•全国•模拟预测)某医科大学科研部门为研究退休人员是否患痴呆症与上网的关系,随机调查了M市

100位退休人员,统计数据如下表所示:

患痴呆症不患痴呆症合计

上网163248

不上网341852

合计5050100

(1)依据a=0.01的独立性检验,能否认为该市退休人员是否患痴呆症与上网之间有关联?

(2)从该市退休人员中任取一位,记事件/为“此人患痴呆症”,8为“此人上网”,则N为“此人不患痴呆症”,

定义事件/的强度匕=,在事件B发生的条件下A的强度为=।.

\-PyA)\-P\A\B\

(i)证明:

匕产(-4)

(ii)利用抽样的样本数据,估计g的值.

*2

附:/=______"(ad-bc》___

其中〃=4+Z?+c+d.

(q+6)(c+d)(〃+c)(6+d)

a0.0500.0100.001

%3.8416.63510.828

8.(2024•高三•山西朔州・开学考试)某校20名学生的数学成绩毛«=1,2,…,20)和知识竞赛成绩

乂(:1,2,「20)如下表:

学生编号i12345678910

数学成绩占100999693908885838077

知识竞赛成绩B29016022020065709010060270

学生编号/•11121314151617181920

数学成绩占75747270686660503935

知识竞赛成绩%4535405025302015105

__207

计算可得数学成绩的平均值是还75,知识竞赛成绩的平均值是亍=90,并且21,-》)"=6464,

1=1

(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到0.01);

(2)设NeN*,变量x和变量》的一组样本数据为{(4其亦=1,2,…,N},其中匕。=1,2,…,N)两两不相同,

%(i=1,2,…,N)两两不相同.记/在{尤(〃=1,2,…,N]中的排名是第&位,%在{yn\n=1,2,-,N]中的排名是

第S,位,i=1,2,…,N.定义变量x和变量J的“斯皮尔曼相关系数”(记为P)为变量x的排名和变量》的排名的

样本相关系数.

6N

⑴记4=K-Sj,,=1,2,…,N.证明:。=1-必、2T4力;

(ii)用⑴的公式求得这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”约为0.91,简述“斯皮尔曼相

关系数”在分析线性相关性时的优势.

注:参考公式与参考数据.

y-y

t=.£.2/("+l)(2"+l)

r=76464x149450»31000.

t")力…)2k=\6

Z=1Z=1

9.(2024・高二•湖北•阶段练习)“难度系数”反映试题的难易程度,难度系数越大,题目得分率越高,难度也

就越小,“难度系数”的计算公式为工=1-5,其中L为难度系数,¥为样本平均失分,少为试卷总分(一般

为100分或150分).某校高二年级的老师命制了某专题共5套测试卷(总分150分),用于对该校高二年级

480名学生进行每周测试,测试前根据自己对学生的了解,预估了每套试卷的难度系数,如下表所示:

试卷序号i12345

考前预估难度系数40.70.640.60.60.55

测试后,随机抽取了50名学生的数据进行统计,结果如下:

试卷序号i12345

平均分/分10299939387

(1)根据试卷2的预估难度系数估计这480名学生第2套试卷的平均分;

(2)试卷的预估难度系数和实测难度系数之间会有偏差,设4为第i套试卷的实测难度系数,并定义统计量

,222

S=1[(ZI-/,.)+(^-Z2)+--+(Z;-Z„)],若S<0.001,则认为试卷的难度系数预估合理,否则认为不

合理.以样本平均分估计总体平均分,试检验这5套试卷难度系数的预估是否合理.

(3)聪聪与明明是学习上的好伙伴,两人商定以同时解答上述试卷易错题进行“智力竞赛”,规则如下:双方

轮换选题,每人每次只选1道题,先正确解答者记1分,否则计0分,先多得2分者为胜方.若在此次竞赛

中,聪聪选题时聪聪得分的概率为g,明明选题时聪聪得分的概率为各题的结果相互独立,二人约定从

0:0计分并由聪聪先选题,求聪聪3:1获胜的概率.

10.(2024•高三・四川成都・开学考试)在三维空间中,立方体的坐标可用三维坐标(4吗,%)表示,其中

%e(051}(1<Z<3,ieN).而在n维空间中(〃22〃eN),以单位长度为边长的“立方体”的项点坐标可表示为

〃维坐标……,%),其中%e{0,l}(14i4%eN).现有如下定义:在"维空间中两点间的曼哈顿

距离为两点,。“)与他也也,也)坐标差的绝对值之和,即为

1%+-引+宿-勾+...+|。"-"I•回答下列问题:

(1)求出"维“立方体”的顶点数;

(2)在n维“立方体”中任取两个不同顶点,记随机变量X为所取两点间的曼哈顿距离

①求出X的分布列与期望;

②证明:在〃足够大时,随机变量X的方差小于0.25/.

(工-4)2

(已知对于正态分布XN(N,吟,p随X变化关系可表示为*e2,)

11.(2024・高二・福建莆田•期末)为了考查一种新疫苗预防某一疾病的效果,研究人员对一地区某种动物进行

试验,从该试验群中随机抽查了50只,得到如下的样本数据(单位:只):

发病没发病合计

接种疫苗81624

没接种疫苗17926

合计252550

(1)能否有95%的把握认为接种该疫苗与预防该疾病有关?

(2)从该地区此动物群中任取一只,记A表示此动物发病,工表示此动物没发病,3表示此动物接种疫苗,

尸(4)P(/⑻

定义事件A的优势凡=丁士幺,在事件B发生的条件下A的优势国=,.

1-尸(4)\-PyA\B^

与=尸(a/)

(i)证明:

&尸(同彳);

(ii)利用抽样的样本数据,给出可理可,尸(创见的估计值,并给出片的估计值.附:

n^ad-bc^

2,其中〃=Q+b+c+d.

z(〃+Z?)(c+d)(Q+c)(b+d)

产(%2E)0.0500.0100.001

X。3.8416.63510.828

12.(2024•高一•山东济南・期末)独立事件是一个非常基础但又十分重要的概念,对于理解和应用概率论和统

计学至关重要.它的概念最早可以追湖到17世纪的布莱兹・帕斯卡和皮埃尔・德・费马,当时被定义为彼此不

相关的事件.19世纪初期,皮埃尔・西蒙・拉普拉斯在他的《概率的分析理论》中给出了相互独立事件的概率

乘法公式.对任意两个事件A与5,如果尸(48)=尸(/)尸(3)成立,则称事件A与事件B相互独立,简称为

独立.

(1)若事件A与事件B相互独立,证明:N与3相互独立;

3

(2)甲、乙两人参加数学节的答题活动,每轮活动由甲、乙各答一题,已知甲每轮答对的概率为),乙每轮

答对的概率为在每轮活动中,甲和乙答对与否互不影响,各轮结果也互不影响,求甲乙两人在两轮活动

中答对3道题的概率.

13.(2024・高二・浙江台州・期末)袋中有大小、形状完全相同的2个红球,4个白球.采用放回摸球,从袋中摸

出一个球,定义T变换为:若摸出的球是白球,把函数〃x)图象上所有点的横坐标缩短到原来需倍,(纵

坐标不变);若摸出的是红球,将函数f(x)图象上所有的点向下平移1个单位.函数/(X)经过1次T变换后

的函数记为工卜),经过2次T变换后的函数记为人(x),…,经过"次T变换后的函数记为Z,(x)(〃eN*).

现对函数/'(x)=lgx进行连续的7变换.

(1)若第一次摸出的是白球,第二次摸出的是红球,求力(x);

(2)记X=求随机变量X的分布列及数学期望.

14.(2024・高三・上海宝山•阶段练习)已知〃为正整数,对于给定的函数了=/(无),定义一个〃次多项式g,,(x)

如下:g“(x)="c"(;[

⑴当/(x)=l时,求g.(x);

(2)当/(x)=x时,求g,,(x);

⑶当1(力=,时,求g,(x).

15.(2024•高一•辽宁葫芦岛・期末)通信信号利用3EC信道传输,若3EC信道传输成功,则接收端收到的信

号与发来的信号完全相同.若信道传输失败,则接收端收不到任何信号.传输技术有两种:一种是传

统通信传输技术,采用多个信道各自独立传输信号(以两个信道为例,如图1).

信道](

U2

BEC信道2

图1

另一种是华为公司5G信号现使用的土耳其通讯技术专家ErdalArikan教授的发明的极化码技术(以两个信道

为例,如图2).传输规则如下,信号。2直接从信道2传输;信号Q在传输前先与。2“异或”运算得到信号式,

再从信道1传输.若信道1与信道2均成功输出,则两信号通过“异或”运算进行解码后,传至接收端,若信

道1输出失败信道2输出成功,则接收端接收到信道2信号,若信道1输出成功信道2输出失败,则接收

端对信号进行自身“异或”运算而解码后,传至接收端.

图2

(注:定义“异或”运算:&㊉。2=乂,乂㊉U=%Xi㊉仇=4天㊉式=5).假设每个信道传输成功的概

率均为P(O<P<1)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论