![定性数据分析课后答案_第1页](http://file4.renrendoc.com/view10/M03/3D/2B/wKhkGWWaCWeAeX-pAAGXgq8Md2s683.jpg)
![定性数据分析课后答案_第2页](http://file4.renrendoc.com/view10/M03/3D/2B/wKhkGWWaCWeAeX-pAAGXgq8Md2s6832.jpg)
![定性数据分析课后答案_第3页](http://file4.renrendoc.com/view10/M03/3D/2B/wKhkGWWaCWeAeX-pAAGXgq8Md2s6833.jpg)
![定性数据分析课后答案_第4页](http://file4.renrendoc.com/view10/M03/3D/2B/wKhkGWWaCWeAeX-pAAGXgq8Md2s6834.jpg)
![定性数据分析课后答案_第5页](http://file4.renrendoc.com/view10/M03/3D/2B/wKhkGWWaCWeAeX-pAAGXgq8Md2s6835.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章课后作业
【第1题】
解:由题可知消费者对糖果颜色的偏好情况(即糖果颜色的概率分布),调查者
取500块糖果作为研究对象,则以消费者对糖果颜色的偏好作为依据,500块糖
果的颜色分布如下表L1所示:
表1.1理论上糖果的各颜色数
橙色黄色红色棕色绿色蓝色
150100100505050
由题知r=6,n=500,我们假设这些数据与消费者对糖果颜色的偏好分布是相符,
所以我们进行以下假设:
原假设:H:类A所占的比例为p=p(i=1,...,6)
0iiiO
其中A为对应的糖果颜色,
则E2检验的计算过程如下表所示:
颜色类别nnp(n-np)2,np
iiOiiOiO
A
11721503.2267
A21241005.7600
A851002.2500
3
A
441501.6200
A36503.9200
5
在这里r靠。检验日1P值等子箱由度为5的E2变量大于等号78.05翻2的概率。
在Exce合理输入“二chidist(18.硼87,5)”,得出对应的Op值为>
故拒绝原假设,即这些数据与消费者对糖果颜色的偏好分布不相符。
【第2题】
解:由题可知,r=3,n=200,假设顾客对这三种肉食的喜好程度相同,即顾客
选择这三种肉食的概率是相同的。所以我们可以进行以下假设:
原假设H:p=—(i=1,2,3)
。i3
则m2检验的计算过程如下表所示:
肉食种类nnp(n-np)2,.np
iii
猪肉8566.675.03958
牛肉4166.679.88374
羊肉7466.670.80589
合计200200三2=15.72921
在这里r=3。检验的p值等于自由度为2的三2变量大于等于15.72921的概率。
在Excel中输入“=chidist(15.72921,2)”,得出对应的p值为
p=0.0003841«0.05,故拒绝原假设,即认为顾客对这三种肉食的喜好程度是
不相同的。
【第3题】
解:由题可知,r=10,n=800,假设学生对这些课程的选择没有倾向性,即选
各门课的人数的比例相同,则十门课程每门课程被选择的概率都相等。所以我们
可以进行以下假设:
原假设H:p=0.1(i=1,2,...,10)
0i
则E2检验的计算过程如下表所示:
类别(课程)
nnp(n-np)2/np
i0iiOiO
174800.4500
292801.8000
383800.1125
479800.0125
580800.0000
673800.6125
777800.1125
875800.3125
976800.2000
1091801.5125
合计800800
£2=5.125
在这里r=lO。检验的p值等于自由度为9的E2变量大于等于5.125的概率。在
Excel中输入“=chidist(5.125,9)”,得出对应的p值为p=0.823278349>>0.05,
故接受原假设,即学生对这些课程的选择没有倾向性,各门课选课人数的频率为
0.L
【第4题】
解:(1)由题可知,r=3,n=5606,假设1997年8月中国股民投资状况的调查
数据和比较流行的说法是相符合。所以我们可以进行以下假设:
原假设:H:类A所占的比例为p=p(i=1,2,3)
0iiiO
其中A(i=1,2,3)为股票投资中对应的赢、持平和亏,p(i=123)已知,
iiO
N3p=1
i=1iO
则E2检验的计算过程如下表所示:
股票投资状况nnp(n-np)2/np
iOiiOiO
A1697560.62303.61213
1
A17801121.2387.10082
2
A21293924.2821.24842
3
合计56065606£2=3511.96137
在这里r=3。检验的P值等于自由度为2的三2变量大于等于3511.96137
的概率。在Excel中输入“=chidist(15.72921,2)”,得出对应的p值为p=0«0.05,
故拒绝原假设,即认为1997年8月中国股民投资状况的调查数据和比较流行的
说法是不相符合的。
(2)解:由题知股票投资中,赢包括盈利10%及以上、盈利10%以下,符合条件
的股民共有151+122=273人;持平可以指基本持平,符合条件的股民共有240
人;亏包括亏损不足10%和亏损10%及以上,符合条件的股民共有517+240=757
人。
由题可知,r=3,n=1270,假设2003年2月上海青年报上的调查数据和比较
流行的说法是相符合。所以我们可以进行以下假设:
原假设:H:类A所占的比例为p=p(i=1,2,3)
0iiio
其中A(i=1,2,3)为股票投资中对应的赢、持平和亏,p(i=1,2,3)已知,
iiO
13p=1
i=1iO
则E2检验的计算过程如下表所示:
股票投资状况
nnp(n-np)2;np
iOiiOiO
A273127167.84252
1
A2402540.77165
2
A75788919.59955
3
合计12701270£2=188.21372
在这里r=3。检验的P值等于自由度为2的E2变量大于等于188.21372的
概率。在Excel中输入“=chidist。88.21372,2)”,得出对应的p值为p=0<<0.05,
故拒绝原假设,即认为2003年2月上海青年报上的调查数据和比较流行的说法
是不相符合的。
【第5题】
解:由题意,我们将“开红花”、“开白花”和“开粉红色花”分别记为A,A,A,
123
并记A所占的比例为p(i=1,2,3),本题所要检验的原假设为:
H:p=p2,p=q2,p=2pq
0123
其中p+q=1,这些p都依赖一个未知参数p=在原假设H成立时的似然函数
为
L(p)OC(p2)24(q2)36(2pq)60xpi08(1-P)132
则对L(p)取对数得
InL(p)=108lnp+132ln(1-p)
从而有对数似然方程
?InL(p)108132n
?pp1-p
B|JW8(1-p)=132po据此求得p的极大似然估计p=0.45,从而得到p的极大
似然估计p=p(p),i=1,2,3o它们分别为0.2025、0.3025和0.495。由此得各
类的期望频数的估计值而,i=1,2,3。它们分别为24.3、36.3、132.20和59.4。
所以三2统计量的值为
m2=(24-24再十(36-36.3)?+(6。-59.4g=°?24
24.336.359.4
这里r=3,m=l,r-m-l=L检验的p值等于自由度为1的三2变量。利用Excel
可以算出p值p=chidist(0.01224,1)=0.911893»0.05,故接受原假设,即我们
认为以上数据在0.05的水平下与遗传学理论是相符的。
【第6题】
解:由题意,我们可以得到以下信息:
①遗传因子的分布律为:(其中p+q+r=l)
遗传因子AB0
概率Pqr
②血型的分布律为:
血型0ABAB
概率
r2p2+2prq2+2qr2pq
将“0”血型、“A”血型、“B”血型和“AB”血型这四类血型分别记为A,......,A,
14
并记A所占的比例为p(i=1,……,4),本题所要检验的原假设为:
H:p=r2,p=p2+2pr,p=q2+2qr,p=2pq
01234
这些p都依赖两个未知参数p.qo在原假设H成立时的似然函数为
i0
L(p,q)父(r2)374(p2+2pr)436(q2+2qr)i32(2pq)58
父(1-p-q)748P436(2-p-2q)436qi32(2-q-2p)132(2pq)58
则对L(p,q)求对数得
InL(p,q)=748ln(1-p-q)+436Inp+436ln(2-p-2q)+132lnq+132ln(2-q-2p)+58In2pq
对lnL(p,q)求偏导数得
(?InL-748,436436n264^58n
|?p1-p-qp2-p-2q2-q-2pp
<?InL-748n872_位13253n
||?q1-p-q2-p-2q42-q-2pq
利用Mathematica软件求解(程序编码及运行结果见附录)
解得p和q的极大似然估计为p如0.289,如0.100,从而得p的极大似然估
计方=p(万,"),i=o它们分别为0.37332、0.43668、0.13220和0.05780»
由此得各类的期望频数的估计值n"i=1,….,4。它们分别为373.32、436.68、
132.20和57.80o所以X2统计量的值为
v(374-373.32)2(436-436.68)2(132-132.20)2(58-57.80)2
3733243668132205780
=0.003292
这里r=4,m=2,r-nrl=l。检验的p值等于自由度为1的X2变量。有Excel可
以算出P值为p=chidist(0.003292,1)=0.954245>>0.05,故接受H,我们认为
0
以上数据与遗传学理论是相符的。
附录
①程序代码:
NSolve[{(-748)/(1-p-q)+436/p+(-436)/(2-p-2*q)+0+(-264)/(2-q-2*p)+58/p
==0,(-748)/(1-p-q)+0+(-872)/(2-p-2*q)+132/q+(-132)/(2-q-2*p)+58/q==0}
,{p,q}]//MatrixForm
②利用Mathematica软件运行结果:
Out[21]//MatrixForm
p)1.56083q)0.0900929)
p)0.209806q)1.50996
P)0.722065q)0.473295
p)0.288632q)0.0999891)
注:在上述结果中由于p+q=1-r<1,所以软件运行的结果中惟独第四个解
满足条件,即p和q的极大似然估计为4~0.2894~0.100。
【第7题】
解:由题知,在豌豆实验中,子系从父系(或者母系)接受显性因子“黄色”
和“青色”的概率分别为p和1-p,而子系从父系(或者母系)接受显性因子
“圆”
和“有角”的概率分别为q和l-qo
我们将豌豆实验中得到的“黄而圆的”、“青而圆的”、“黄而有角的”和“青而有
角的”这四类豌豆分别记为A,A,A,A,则这四类豌豆的分布律如下表所
1234
示:
豌豆类型
AAAA
1234
概率
Pq(2-p)(2-q)q(2-q)(1-p)2P(2-p)(1-qg(1-p)2(i-qg
将豌豆类型A所占的比例记为p(i=1,……,4),则本题所要检验的原假设为:
H:P=pq(2-p)(2-q),p=q(2-q)(1-p)2
012
p=p(2-p)(1-q)2,p=(1-p)2(l-q)2
34
这些p都依赖两个未知参数p,qo在原假设H成立时的似然函数为
i0
L(P,q)体[pq(2-p)(2-q)]3is[q(2-q)(1-p)2]ios[p(2-p)(1-q)2]wi[(1-p)2(1-q间32
体P416q423(2-P)416(2-q)423(1-p)280(1-q)266
则对L(p,q)求对数得
对lnL(p,q)求偏导数得
InL(p,q)=416
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年五年级上学期英语教师工作总结范例(二篇)
- 2025年产品销售运输三方协议(2篇)
- 2025年亮化工程施工合同标准版本(4篇)
- 2025年临时人员劳动合同常用版(2篇)
- 2025年个人购买墓地协议(2篇)
- 旗舰店铺内墙装修工程协议
- 2025年度安全生产费用使用监督合同
- 2025年度城市综合体安全保卫服务合同范本
- 化妆品运输保险协议样本
- 绳锯切割楼板施工方案
- 2025年中国铜画市场调查研究报告
- 山西省太原市2024-2025学年九年级上学期期末历史试题(含答案)
- 2024年全国体育专业单独招生考试数学试卷试题真题(含答案)
- 2025届高三八省联考语文试卷分析 课件
- 2025年度检修计划
- 2024-2025学年冀教版数学五年级上册期末测试卷(含答案)
- 商业综合体市场调研报告
- 资源枯竭型城市的转型发展 课件 2024-2025学年高二上学期地理人教版选择性必修2
- 少儿素描课件
- 2025届河北省衡水市衡水中学高考仿真模拟英语试卷含解析
- 天津市部分区2023-2024学年高二上学期期末考试 生物 含解析
评论
0/150
提交评论