统计学全套课件_第1页
统计学全套课件_第2页
统计学全套课件_第3页
统计学全套课件_第4页
统计学全套课件_第5页
已阅读5页,还剩919页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024-2-121/80第1章《概率論》基礎知識2024-2-122/80一、隨機事件及其概率1.隨機試驗(試驗)在相同條件下可重複進行;每次試驗的可能結果不只一個且試驗前知道所有可能的結果;每次試驗只出現一個可能結果但試驗前不知道出現哪個結果。l基本事件(樣本點):隨機試驗的每一個可能結果;l樣本空間(Ω):全體基本事件組成的集合。2024-2-123/80隨機試驗舉例

試驗

試驗結果拋硬幣 正面,反面抽取一個零件檢查 合格,不合格足球比賽 贏,輸,平局問題:寫出上述試驗的基本事件和樣本空間2024-2-124/802.隨機事件(事件)在某個隨機試驗中,對一次試驗而言,可能出現(發生)也可能不出現(發生)的事件。l基本事件是隨機試驗中最簡單的隨機事件;l

隨機事件由若干個基本事件組成,是樣本空間的子集;l

必然事件(Ω)l不可能事件(

2024-2-125/803.事件的關係與運算l

事件的包含:

A

B(A

B)或B

A(B

A)事件A出現必然導致事件B出現,稱事件B包含事件A,記為

A

B或B

Al事件的相等:A=B2024-2-126/80l

事件的並(和):A∪Bl

事件的交(積):A∩B或AB2024-2-127/80l

互不相容(互斥)事件:AB=

l

對立事件:A∪B=Ω且AB=

,則稱B為A的對立事件,記B=l事件的差:A-B問題:對立事件與互斥事件的關係?2024-2-128/804.事件的概率l

頻數、頻率l

概率的古典定義:l

概率的公理化定義:①非負性:0

P(A)

1②

規範性:P(Ω)=1,P(φ)=0③完全可加性:問題:頻率與概率的關係2024-2-129/80圖解完全可加性:A1A2A3

2024-2-1210/80

l

概率的性質①

P(A∪B)=P(A)+P(B)-P(AB)②

若A

B則P(B-A)=P(B)-P(A)

A2024-2-1211/80條件概率:概率的乘法公式:

P(AB)=P(A)P(B|A)=P(B)P(A|B)l

全概率公式:2024-2-1212/80貝葉斯公式:事件的獨立:若P(B|A)=P(B),其中P(A)>0;或P(AB)=P(A)P(B);則稱事件B與事件A獨立。2024-2-1213/80案例:兩家供貨商(A1,A2)品質等級問題描述圖示:P(A1G)=P(A1)P(G/A1)A1(0.65)A2(0.35)G(0.98)B(0.02)G(0.95)B(0.05)P(A1B)=P(A1)P(B/A1)P(A2G)=P(A2)P(G/A2)P(A2B)=P(A2)P(B/A2)注釋:G表示零件品質優良;B表示零件品質糟糕2024-2-1214/80兩家供貨商(A1,A2)品質等級分析:

P(G|A1)=0.98P(B|A1)=0.02P(G|A2)=0.95P(B|A2)=0.05P(A1,G)=P(A1)P(G|A1)=0.65

0.98=0.6370P(A1,B)=0.0130P(A2,G)=P(A2)P(G|A2)=0.35

0.95=0.3325P(A2,B)=0.0175

購買零件後發現品質問題,來自A1或A2的概率為

P(A1|B)=0.4262P(A2|B)=0.57382024-2-1215/805.例題(1)求滿足條件的概率擲1顆骰子,點數大於3的概率;擲2顆骰子,點數之和等於5的概率;2024-2-1216/80解:設X、Y為點數P(x>3)=P(x=4)+P(x=5)+p(x=6)=1/6+1/6+1/6=1/2P(x+y=5)=P(x=1,y=4)+P(x=2,y=3)+P(x=3,y=2)+P(x=4,y=1)=P(x=1)P(y=4)+P(x=2)P(y=3)+P(x=3)P(y=2)+P(x=4)P(y=1)=1/36+1/36+1/36+1/36=1/92024-2-1217/80(2)已知10個燈泡中有3個次品,現隨機抽取4個,求至少有2個次品的概率。2024-2-1218/80解:設A表示事件“取4個燈泡至少有2個次品”

A1表示事件“取4個燈泡恰有2個次品”

A2表示事件“取4個燈泡恰有3個次品”2024-2-1219/80(3)供貨商已知1000件某產品中有5件次品,進貨商從中隨機抽取10件,若發現1件次品則拒絕接受這批貨物。問這批貨物被拒絕的概率是多大?並對計算結果加以理解。解:設A表示事件“這批貨物被拒絕”,則2024-2-1220/80(4)華夏公司研發部成立兩個獨立工作組以攻克某技術難關,若兩個組獨立攻克該技術難關的概率分別為40%與30%,問該公司能攻克該技術難關的可能性有多大?2024-2-1221/80解:設B表示“該公司攻克該技術難關”,設A1表示“第一組攻克該技術難關”,設A2表示“第二組攻克該技術難關”2024-2-1222/80(5)某商場黃金周舉辦摸獎促銷活動,一個木箱裏放有4個紅球,6個黃球和10個白球。規定:

a.在本商場購物滿100元者均可摸獎;

b.一次摸一個球,連續摸3次;

c.如果摸得的3個球同為紅色獲一等獎;同為黃色獲二等獎;同為白色獲三等獎。問:①放回與不放回有區別嗎?

②一、二、三等獎的中獎概率有多大?③你認為商家會採用哪種方案?2024-2-1223/80解:不放回的情形一等獎中獎概率二等獎中獎概率三等獎中獎概率2024-2-1224/80解:放回的情形一等獎中獎概率二等獎中獎概率三等獎中獎概率2024-2-1225/80兩種情形下結果比較一等獎中獎概率二等獎中獎概率三等獎中獎概率不放回1/2851/572/19放回1/12527/10001/8結論:商家採用“不放回”方式。2024-2-1226/80(6)甲、乙、丙三個機床生產一批產品,它們的產量分別占總產量的25%,35%,40%,甲、乙、丙三機床產品中的廢品率分別為0.05,0.04,0.02。①從這批產品中隨機地取出的一件為廢品,求所取的廢品是甲機床生產的概率.②

求從這批產品中隨機地取出的一件為合格品的概率。

2024-2-1227/80解:①

設A表示事件“取出的一件產品為廢品”,

B1表示事件“取出的產品是甲機床生產的”,

B2表示事件“取出的產品是乙機床生產的”,

B3表示事件“取出的產品是丙機床生產的”,則

B1UB2UB3=Ω,且B1,B2,B3兩兩互不相容,

A=AB1UAB2UAB3

由題設

P(B1)=0.25,P(B2)=0.35,P(B3)=0.40P(A|B1)=0.05,P(A|B2)=0.04,P(A|B3)=0.022024-2-1228/80由貝葉斯公式2024-2-1229/80②從這批產品中隨機地取出的一件為合格品的概率2024-2-1230/80案例:美國某警察局問題共有員警1200人,男性960人,女性240人,過去兩年中,男性提升288人,女性提升36人(共提升324人)判斷:是否有性別歧視。升職資訊表

男性(M)女性(W)合計提升人數28836324未提升人數672204876合計96024012002024-2-1231/80由上表得出概率資訊

P(MY)=288/1200=0.24P(MN)=672/1200=0.56P(WY)=36/1200=0.03P(WN)=204/1200=0.17聯合概率分佈及邊緣概率為

男性(M)女性(W)合計提升(Y)0.240.030.27未提升(N)0.560.170.73合計0.800.201.002024-2-1232/80計算及結論:P(Y|M)=288/960=0.30即:P(Y|M)=P(MY)/P(M)=0.24/0.8=0.30同理:

P(Y|W)=P(YW)/P(W)=0.03/0.2=0.15結論:女性提升率明顯偏低。2024-2-1233/80簡單練習(1)100件產品中有70件一等品,25件二等品,5件廢品。問任抽1件產品是合格品的概率是多少?(2)投資房地產賺錢的概率是0.7,投資電腦軟體業的成功率是0.8,同時投資的成功率是0.6,問投資二者中至少一種賺錢的概率為多少?2024-2-1234/80二、隨機變數

1.隨機變數的概念設E是隨機試驗,樣本空間Ω={ω},如果對於每一個ω∈Ω,有一個實數X(ω)和它對應,則稱這個定義在Ω上的實值單值函數X(ω)為隨機變數,簡記X(ω)為X。2.隨機變數的分類離散型隨機變數與連續型隨機變數2024-2-1235/803.離散型隨機變數概率分佈分佈函數XX1X2……Xk……PP1P2……Pk……2024-2-1236/80l

常見的分佈(1)(0—1)分佈

X只取0與1兩個值,且P(X=1)=p,P(X=0)=1-p,(0<p<1)(2)二項分佈

(X~B(n,p))(Bernoulli)問題:為什麼0<p<1,可以為0或1嗎?2024-2-1237/80(3)泊松(Poisson)分佈

(X~P(λ)或X~π(λ))2024-2-1238/80Poisson分佈的特點1)試驗由觀察在一連續間隔期內某一事件的發生次數x組成2)任何兩個相等的間隔期內某一事件發生的次數的概率相等3)各間隔期內事件是否發生相互獨立2024-2-1239/80(4)超幾何分佈如果有N個產品,其中有M個次品。從中隨機(不放回)地抽取n個,這n個產品中含次品X個,概率分佈為2024-2-1240/804.連續型隨機變數概率密度函數(概率密度)問題:公式說明什麼問題?2024-2-1241/80l

分佈函數問題:性質的幾何意義?2024-2-1242/80l

常見分佈(1)均勻分佈2024-2-1243/80(2)指數分佈2024-2-1244/80(3)正態分佈

[X~N(μ,σ2)]

2024-2-1245/802024-2-1246/802024-2-1247/80l標準正態分佈

[X~N(0,1)]

問題:(0)=?

2024-2-1248/80l

一般正態分佈標準化2024-2-1249/805.例題(1)某城市郊區公共汽車每隔15分鐘開一班車,李先生到達車站的時間是隨機的,求李先生至少要等8分鐘才能上車的概率。2024-2-1250/80解:設X為乘客候車時間,則X在[0,15]服從均勻分佈,故2024-2-1251/80

(2)某機器生產的鋼球直徑X(cm)服從N(10.05,0.062),規定直徑在10.05±0.12為合格品,求:該機器生產的鋼球為不合格品的概率。2024-2-1252/80解:合格的概率:不合格的概率:1-0.9545=0.04552024-2-1253/80(3)某公司的設備相互獨立工作,每臺設備發生故障的概率均為0.01,問:①若1人負責維修20臺,設備發生故障而不能及時維修的概率;②若3人共同負責維修80臺,設備發生故障而不能及時維修的概率;③上述計算結果說明什麼問題?2024-2-1254/80解:①設X表示20臺設備中發生故障的台數,X~B(20,0.01),根據Poisson逼近定理,

=np=0.2,發生故障不能及時維修即有兩臺或兩臺以上設備發生故障,故2024-2-1255/80②設Y表示80臺設備中發生故障的台數,Y~B(80,0.01),根據Poisson逼近定理,

=np=0.8,發生故障不能及時維修即有4臺或4臺以上設備發生故障,故②與①比較,每個工人的任務重了,但工作效率提高了。(因0.009<0.0175)2024-2-1256/80簡單練習馬丁服裝店問題進入商店三名顧客,每人要購物的概率為0.3,其中2人要購物的概率是多少?2024-2-1257/80三、隨機變數的數字特徵

1.數學期望性質:C為常數,X為隨機變數,則

E(C)=C;E(C+X)=C+E(X);E(CX)=CE(X);

E(X+Y)=E(X)+E(Y);

E(X-Y)=E(X)-E(Y);l

X與Y互相獨立,則E(XY)=E(X)E(Y)2024-2-1258/802.方差D(X)=E{[X-E(X)]2}=E(X2)-[E(X)]2性質:C為常數,X為隨機變數,則

D(C)=0,D(X+C)=D(X);D(CX)=C2D(X)l

X與Y互相獨立,則D(X±Y)=D(X)+D(Y)2024-2-1259/80*標準差:3.協方差

cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=E(XY)-E(X)E(Y)4.相關係數2024-2-1260/805.例題(1)某種彩票2元/張,特等獎50萬元,一等獎1萬元,二等獎1000元,三等獎100元,中獎概率依次為1/1000000,1/100000,1/10000,1/1000,錢先生買了一張該彩票,求其預期收益並進行投資可行性分析。2024-2-1261/80解:因-2+0.8=-1.2<0,故不可行。問題:明知投資不可行,為何仍有人購買彩票?2024-2-1262/80(2)某報童賣晨報,當天購進的報紙必須當天銷售,假設:每賣掉一份賺0.3元,否則虧0.1元/份;他進貨只能是50份,100份,150份和200份;市場需要50份,100份,150份和200份的概率依次為20%,40%,30%和10%,請你幫該報童決策每天應購進多少份報紙?2024-2-1263/80解:(請填寫下麵損益表)

狀態方案M1(50)M2(100)M3(150)M4(200)期望收益A1(50)A2(100)A3(150)A4(200)概率2024-2-1264/80

狀態方案M1(50)M2(100)M3(150)M4(200)期望收益A1(50)1515151515A2(100)1030303026A3(150)525454529A4(200)020406026概率0.20.40.30.1/2024-2-1265/80(3)3

準則及六西格瑪管理2024-2-1266/80DefinitionofsixsigmaWhateverwedo,themaximumerrornumberwhichisallowedtomakeshouldnotgobeyond3.4timesamong1000000opportunities.2024-2-1267/80(4)某大學計畫今年招收2000名新生,新生入學後進行為期一個月的軍訓,故必須訂做2000套軍訓服裝。根據經驗,新生身高服從均值為170釐米,方差為25的正態分佈。問:小號(適合身高160釐米以下者穿)、中號(適合身高160~170)、大號(適合身高170~180)、特大號(適合身高180以上)的服裝各訂做多少套?2024-2-1268/80解:設X表示新生的身高,則X~N(170,25)①②2024-2-1269/80③④

2024-2-1270/80所以小號、中號、大號、特大號服裝分別訂做20000.02275=45.5(套)20000.47725=954.5(套)20000.47725=954.5(套)20000.02275=45.5(套)2024-2-1271/80案例:格雷爾輪胎公司問題

輪胎測試資料得到:均值36500公里,標準差5000公里問:1)行程大於40000公里的輪胎比例

2)如果輪胎沒有超過指定的行駛里程,保證給予折扣更換。希望打折數不超過10%。應保證的里程數是多少?2024-2-1272/801)x~N(36500,50002)2024-2-1273/802)2024-2-1274/80四、大數定律和中心極限定理1.大數定律獨立同分佈大數定律:獨立隨機變數具有相同分佈,且存在有限的數學期望和方差,則對任意小的正數

,有2024-2-1275/80貝努力大數定律:設m是n次獨立隨機試驗中事件A發生的次數,p是事件A在每次試驗中發生的概率,則對任意小的正數

,有2024-2-1276/802.中心極限定理獨立同分佈大數定律:獨立隨機變數具有相同分佈,且存在有限的數學期望和方差,則n

時,有2024-2-1277/80德莫佛-拉普拉斯(Demoivre-Laplace)中心極限定理:

若x表示n次獨立隨機試驗中事件A發生的次數,p是事件A在每次試驗中發生的概率,則x~B(n,p);n

時,X趨於均值為np,方差為npq,即x~N(np,npq)。2024-2-1278/803.例題設有40個電子元件D1,D2,…,D40,它們的使用情況如下:D1損壞,D2立即使用,D2損壞,D3立即使用,……。設每個電子元件Di的壽命xi是相互獨立同分佈的隨機變數,E(xi)=10,D(xi)=10,令x為40個電子元件使用的總壽命(單位:小時),求P(420<x460)2024-2-1279/80解:

經過標準化後近似服從正態分佈,2024-2-1280/80

故2024-2-1281/182第2章數據的整理與抽樣2024-2-1282/182一、統計學中的基本概念(一)統計資料1.統計資料的定義、分類與性質可以推導出某項論斷的事實或數字都稱為統計資料。統計資料是統計分析、統計推斷和預測的基礎。統計資料分為:原始(初級)資料與次級資料。統計數據可分:數量數據和品質數據;時間序列數據和橫截面數據。測量尺度:對事物進行分類的依據種類:①定類尺度②定序尺度③定距尺度④定比尺度2024-2-1283/182四類尺度的區別①定距、定比尺度有確定的計量單位,定類、定序尺度沒有確定的計量單位。②定比尺度有絕對意義上的零點,定距尺度沒有絕對意義上的零點。③定距、定比變數的值均以數字表示,能進行數學計算;定類、定序變數不能進行數學計算。④定距尺度只能進行加、減運算;定比尺度能進行加、減、乘、除運算。2024-2-1284/182四類尺度對應四類數據①定類數據Nominal範疇例,男-女列舉②定序數據Ordinal範疇由排序導出例,高-低列舉③定距數據Interval等距區間非真值0例,攝氏度測量④定比數據Ratio等距區間真值0有意義的比值例,用釐米表示的身高2024-2-1285/1822.為什麼要收集數據?WhyCollectData?1)為研究提供素材2)評價生產過程或服務效果3)幫助闡明決策路線4)滿足好奇心5)進行知識積累2024-2-1286/182數據的類型及來源基本概念:數據(Data):是經過收集、分析、概括後用來表達和說明事實的數字;數據集(DataSet):因某項特定研究所收集的數據合在一起的數字;個體(Elements):收集數據所依賴的對象;變數(Variables):單位中所感興趣的特徵;觀測值(Observations):為某個單位而收集的測度值的集合。2024-2-1287/18228屆奧運會獎牌榜美國3539中國3217俄羅斯2727澳大利亞1716日本169德國14162914381612182024-2-1288/182數據類型DataTypes數據數值數據(定量的)類型數據(定性的)離散的連續的2024-2-1289/182品質數據和數量數據品質數據(QualitativeData)

用來識別單位某一特徵的標記或名稱。品質數據是定性變數。數量數據(

QuantitativeData)

表示多少或多少個的數據。數量數據是定量變數2024-2-1290/1822橫截面數據和時間序列數據橫截面數據(Cross-SectionalData)

在同一時刻或幾乎同一時點所收集到的數據。時間序列數據(TimeSeriesData)

在若干時期內所收集到的數據2024-2-1291/182數據類型舉例1.數量數據離散的到現在為止你訂過多少種雜誌?___(數字)連續的你有多高?___(釐米)2.品質數據你有存摺嗎?__有__沒有2024-2-1292/182思考題它們是類型數據還是數值數據?是離散還是連續?使用了哪一種計量方法?4. 溫度78,64,85等等.5. 兄弟姐妹個數0-2,3-5,6-86. 成績A,B,C等等.1. 性別男,女2. 體重123,140.2等等.3. 汽車速度78,64,45等等.2024-2-1293/182例:5只股票的數據集

股票交易所股票代號年銷售額每股收益市盈率

A櫃檯交易00017.40.5222.1B紐約證交000254.70.3214.1C美國股交000320.70.2532.5D櫃檯交易000444.30.1815.6E紐約證交000554.20.2418.2識別單位、變數、觀測值;區分品質和數量數據2024-2-1294/1823.統計資料收集的方法間接引用或直接收集4.統計資料收集的組織方式

A.統計報表

B.專門調查(普查,抽樣調查,重點調查,典型調查)。5.統計資料收集的途徑直接觀察、試驗、訪問調查、問卷調查中國統計年鑒2001中國人口統計年鑒中國市場統計年鑒世界發展報告世界經濟年檢工業普查數據中國統計出版社2024-2-1295/182思考以下問題問題1:抽樣調查顯然不及普查準確,為何使用抽樣調查法?問題2:調查對象與調查單位及填報單位的關係。問題3:重點調查與典型調查的關係。問題4:調查時間的涵義。問卷調查案例(2個)2024-2-1296/182案例1:ABC公司員工問卷調查背景介紹

ABC公司是一個汽車零件生產商,它擁有9800名員工。為了提高效率和生產力,公司實行了全面品質管理(TQM)。作為管理工作的一部分,公司董事會希望為所有全職員工建立檔案,衡量他們的工作滿意程度,估算他們的供職期限和事業發展,並評價他們的工作熱情、態度和信念。主管人力資源的副總裁巴德·康利雇傭了B&L公司(一家員工利益諮詢公司)來調查ABC的員工。

2024-2-1297/182

經過仔細的考慮,康利和B&L公司的統計學家們確定通過辦公室間信件就可以完成所需的調查,並獲得關於工作滿意程度和收入的精確的評估。他們設計了一份問卷並準備進行初步測試。副總裁和統計學家們將評價得到的結果,然後做出適當的修改,如果時間和預算允許他們將再選用另一組人做第二次測試,並進一步改進調查問卷。

2024-2-1298/182附件1展示了這份問卷中的問題,共有28個。這是副總裁和統計學家們最終的設計。統計學家們不得不考慮的一個主要問題是應該調查多少全職員工才能使B&L公司獲得足夠的資訊來設計一個員工利益計畫,以使得卡洛沙工業公司的工人感到滿意,加強他們與管理層之間的關係,並展示出客戶公司通過創造全面品質管理(TQM)環境,正逐漸成為行業的領導者,這是董事會的要求。因此,B&L公司的目標就是通過從受試樣本獲得的結果來估測卡洛沙工業公司的員工全體。

2024-2-1299/182樣本選擇

副總裁和統計學家們確定,在整個問卷調查中第7題和第9題是這一調查中至關重要的數據,所需的樣本數量正是基於這一事實確定的(方法將在以後的學習仲介紹)。就像我們下麵要看到的,所需的樣本是ABC公司總共9800名全職員工中的400人。由於不是所有的員工都願意接受調查,副總裁必須把它寄給更多一些的人。根據諮詢公司過去企業內調查的經驗,十個工人裏估計有九個會對這樣的調查做出回答(也就是說回饋率是90%);於是總共需要聯繫445名這樣的員工,以獲得所需的400份完成的問卷。因此,這份最終問卷被分發給了從ABC公司的人事檔案中抽取的445名全職員工。2024-2-12100/182為了抽取隨機樣本,統計學家們選擇使用一個亂數表。在人力資源副總裁巴德·康利的幫助下,他們從人事檔案中得到了ABC公司全部9800員工的姓名和公司信箱號碼,並製作了一份列表。由於總體個數(9800)是一個四位數,所以每一個被分配的編碼也必須是四位數,這樣每一個員工才會有同等的機會被選中。在ABC公司員工的整體列表中,分配給第一個員工的編碼是0001,分配給第二個員工的是0002,…,分配給第1752個員工的是1752,這樣繼續下去直到9800被分配給列表中的第N個員工。由於N=9800是編碼的最大可能值,大於N的其他編碼(即從9801到9999和0000)都被忽略。

2024-2-12101/182為了選擇隨機樣本,必須隨機指定一個亂數表的起始點。一種辦法是閉上眼睛用鉛筆劃出表中的亂數。假定統計學家們通過這樣的過程選定了附表中的行06和列05作為初始點。在表中依次從左向右讀出連續的4位數字,就選定了將被調查的一個員工。

在樣本中編碼為0033的那個人就是第一位員工(列06,行05到08)。第二個人的編碼是6488(列06,行09到12)。第三位到第十位員工的編碼分別是4720,4334,6391,9363,9411,0959,2470和7054。

2024-2-12102/182選擇過程以類似的方式繼續,直到選出了所需的445名全職員工。為了做到這一點需要兩頁的亂數表。在選擇過程中,如果某個四位編碼序列重複出現,在有放回抽取樣本時,就把這個編碼所對應的員工再次包括到樣本中;在無放回抽樣時,忽略重複的編碼就可以了。注意編碼序列4205出現在第12行,第33列到36列,並又一次出現在第21行,第21列到24列。因為B&L公司的統計學家們採取無放回抽取樣本,拋棄了重複編碼之後他們就得到了445名全職員工的樣本。2024-2-12103/182ABC員工滿意程度調查問卷

(1).包括所有的職位,上一周您一共工作了多少小時?____(2).您的職業是什麼?

A.經理人員

B.專業人員

C.技術/銷售人員

D.管理支持人員E.服務人員

F.生產人員

G.體力勞動人員

(3).您的年齡是多少(在上一次生日時)?____(4).您一共完成了多少年的學業?____

(5).您的性別是什麼?

A.男

B.女

(6).在您全家所有家庭成員中,包括您本人,去年有多少人工作?____(7).您去年的“稅前”收入有多少(以千美元為單位)?____2024-2-12104/182(8).您全家去年的“稅前”總收入是多少(以千美元為單位)?____(9).總的來說,

您對您的工作有多滿意?

A.非常滿意

B.中等滿意

C.有些不滿

D.非常不滿(10).如果您由於繼承、獲贈或中獎在一夜之間變為巨富,您會停止工作退休嗎?

A.會

B.不會

C.不能肯定(11).下列工作特點哪一項對您最重要?

A.高收入

B.沒有被解雇的危險

C.靈活的工作時間

D.晉升的機會

E.工作的樂趣2024-2-12105/182(12).絕大多數人通過下列哪一條途徑在事業上取得進展?

A.勤奮工作

B.勤奮工作加運氣

C.運氣(13).您去年經歷了多少不幸的事件(近親/朋友去世、離婚/分居、失業、殘疾)?

_____(14).您現在是工會成員嗎?

A.是的

B.不是(15).自從您16歲那年起,您為獲得報酬而全職工作了大約多少年?____(16).您為您現在的公司總共工作了少年?____(17).您在為您的公司工作時一共獲得了多少次晉升?____2024-2-12106/182(18).在未來的五年裏,您有多大的機會被提升?

A.非常可能B.可能C.不確定D.不大可能

E.幾乎不可能(19).與您同性別的職工獲得提升的機會更好還是更差?

A.更好 B.更差 C.沒有影響(20).自您在本組織的第一次全職工作開始,您會如何描述您的“進展”?

A.進展迅速B.穩步進展C.幾乎停滯D.今不如昔(21).您在工作中有機會參與那些影響到您的工作的決策嗎?

A.總是有B.經常有C.有時有D.從未有2024-2-12107/182(22).作為您的工作的一部分,您參與預算決策嗎?

A.參與 B.不參與(23).您對在這個組織裏工作感到自豪嗎?

A.非常自豪B.自豪C.無所謂D.沒什麼值得自豪的(24).為了繼續留在這個組織中,您會拒絕薪水更高的另一份工作嗎?

A.很可能會 B.可能會 C.不能肯定

D.可能不會 E.很可能不會(25).一般來說,您會如何描述您工作的地方經理和雇員之間的關係?

A.非常好 B.好 C.一般D.不好E.非常不好2024-2-12108/182(26).一般來說,您會如何描述您工作的地方同事之間的關係?

A.非常好 B.好C.一般D.不好E.非常不好(27).您以前的學習對您現在的工作有多重要?

A.非常重要B.重要C.有點重要 D.完全不重要(28).您以前的在職培訓對您現在的工作有多重要?

A.非常重要B.重要C.有點重要 D.完全不重要2024-2-12109/182Excel中亂數的生成方法一、安裝分析工具庫步驟:1.啟動Excel;2.選取“工具”中的“加載宏”並單擊;3.選取“分析工具庫”,單擊“確定”。二、以Excel中的亂數發生器產生亂數(具體操作通過以下例題說明)2024-2-12110/182某品質管理員要抽樣調查公司所生產的物品是否符合標準。該物品共有1000件,由於無法一一檢查,他想從中抽取10件進行檢測,請問該抽哪10件?作法1.先將物品編流水號,分別為1,2,…,1000。2024-2-12111/1822.以Excel中的亂數發生器產生亂數(randomnumber)。首先選取“工具”

“數據分析”

“亂數發生器”,然後單擊右上角的“確定”按鈕,並鍵入如下圖所示的數據。2024-2-12112/1822024-2-12113/182

其中變數個數在此為1個,亂數個數為10個(也就是被選中物品的編號)。分配為均勻分佈,因為每件物品被選到的概率均等。參數介於0到1000,表示物品編號為1至1000。亂數基數如果是空白的話,每次產生的亂數值就不一樣。現輸入123,以後(明天)再重新產生10個數,只要基數鍵入123,就會得到10個相同的亂數,輸出工作表為均勻分佈亂數,2024-2-12114/182單擊“確定”按鈕後得到如下圖所示的結果。2024-2-12115/1823.圖中的數字有小數點,必須四捨五入,可用ROUND函數進行。在B1中鍵入“=ROUND(A1,0)”,表示要將A1中存放的數值四捨五入至整數,然後複製至B10,得到如右圖所示的結果。這10個數字就是所欲抽樣的物品編號。2024-2-12116/182在前面圖中“變數個數”鍵入1,因為只需要一個樣本即可。如果需要多個樣本,就鍵入所需的樣本數目。有時在“亂數個數”中會鍵入比所欲抽樣數目10大些的數字,例如15,以避免亂數重複出現,這是因為亂數的產生採取放回法抽樣(samplingwithreplacement),也就是可能重複被抽到。如果發現重複出現,只要跳過即可。2024-2-12117/182尊敬的先生、女士:我們是中南大學的學生。為了積極參與貫徹國家關於擴大內需推動經濟增長的方針和理論與實踐相結合的教育原則,在老師指導下我們組織了這次千戶居民的社會調查。請您給予支持。調查不記名,全部資料用電腦處理,絕對保密和安全,您只需在符合您的情況的答案上打個勾,花費幾分鐘時間。謝謝!案例2:長沙市城市居民消費與投資傾向調查問卷2024-2-12118/182(1)您家是否已經擁有下列耐用家電設備

A.□彩電B.□組合音箱C.□VCD(或DVD)

D.□冰箱E.□空調,F.□電腦(2)您家的住房是:

A.□租賃公房,B.□有產權公房,

C.□新商品房,D.□其他(請注明)(3)您家今明兩年是否準備以下專案支出:

A.□購買家電設備 B.□購買成套家俱

C.□購買汽車D.□購買(或置換)房屋

E.□現有住房裝修 F.□支付子女教育費

G.□國內或國際旅遊 2024-2-12119/182(4)您今明兩年不准備上列大專案支出的主要原因是:(選填3項)

A.□沒有必要 E.□售後服務差

B.□經濟不寬裕 F.□價格不合理

C.□品牌不中意 G.□其他(請注明)

D.□品質信不過(5)您購買商品考慮的主要因素是:

A.□實用價值 D.□品牌

B.□商品品質

E.□售後服務

C.□價格 (請按您認為的重要性□在中寫上位序)

2024-2-12120/182(6)您家平均每月總收入是:

A.□500元以下 E.□2000~3000元

B.□500~1000元 F.□3000~5000元

C.□1000~1500元 G.□5000~8000元

D.□1500~2000元 H.□8000元以上(7)您家平均每月日常生活費開支是

元,

其中用於吃(食品)支出大約是

元(8)您認為您家近幾年生活水準是

A.□B.□C.□ D.□ E.□提高很多略有提高沒有變化略有下降下降很多2024-2-12121/182(9)您收入節餘用予以下哪些項?各項約占多大比重?

A.銀行儲蓄()%B.國債(國庫卷)()%C.基金()%D.其他債券()%E.股票()%F.保險()%G.其他()%(10)您存錢的主要目的是:

A.□購買設備B.□購買住房C.□結婚

D.□子女教育 E.□養老防病F.□旅遊 (請按你認為的重要性在□中寫位序)2024-2-12122/182(11)您是否瞭解現在推行的信貸消費

A.□不了解B.□瞭解一點

C.□瞭解D.□很瞭解(12)您是否打算參加信貸消費:

A.□是B.□不(跳過第13問題)(13)您信貸消費的專案是()(請按第3題的編號填寫)2024-2-12123/182(14)您是否同意下列看法:很同無不很同意所同不意謂意同 意

A.信貸消費不合中國國情

B.信貸消費是資本主義國家的做法

C.信貸消費是先甜後苦

D.借債享受有風險

E.借債消費不光彩

F.信貸消費是現代通行的做法

G.只要量力借貸,有利無害

H.發展信貸消費能促進經濟增長 2024-2-12124/182(15)最後,瞭解一下您的基本情況

①您的性別:A.□男B.□女

②您的年齡:

周歲

③您的文化程度:

A.□不識字或識字不多B.□小學C.□初中

D.□高中或中專E.□大專或大學以上

④您家庭人口數

人其中(i)在業

人;(ii)離退休

人;(iii)失業、下崗

人;(iv)在校學生

⑤您的職業

(見卡片)⑥職務

2024-2-12125/182

(二)總體與個體1.定義凡是客觀存在的、具有統一性質的若干個別事物的集合體,就稱為統計總體(population)。構成總體的個別事物稱為個體(總體單位)總體樣本2024-2-12126/1822.總體和個體的必備條件(1)客觀性總體和個體必須是客觀存在的具體事物。(2)大量性總體的個體須是大量的(足夠多),因為統計的目的是反映大量現象的規律和特點。2024-2-12127/182(3)同質性總體的個體在性質上須相同,因為統計研究的目的是反映總體的特性。例如,將機械零件與書本放在一起,就不會得出整個總體的任何結論。(4)差異性如10000件產品雖屬同一種產品,但在品質、顏色、尺寸等方面不盡相同。若所有個體都完全相同的話,就無必要進行統計研究了。如:同一種郵票800枚(同時出版)要研究這種郵票的面值、版面設計、圖案花紋等,只需任取一枚郵票進行鑒賞,就能通曉800枚郵票。這種研究方法不是統計方法。2024-2-12128/1823.總體的分類按其包含的個體數目可分:有限總體與無限總體。按其個體的時間分:

空間總體(個體處於同一時間的不同空間),如人口普查,全國總人口即為空間總體.

時間總體(個體處於同一空間的不同時間),如某商店一年的銷售情況,即是時間總體。總體與個體的概念是相對的!2024-2-12129/182(三)樣本(sample)1.定義從總體中抽取出來進行調查並據以推斷總體的那部分個體。樣本中包含的個體數目稱為樣本容量,用n表示,n>30,大樣本,反之,小樣本。樣本容量n與總體容量N的比,n/N稱為抽樣比,用f表示。2024-2-12130/1822.樣本的類型(1)代表性樣本樣本單位頻數是某種特徵的樣本單位占總樣本單位數的比例。總體的頻數是某種特徵的個體占總體的比例。若樣本單位頻數與總體的頻數成正比,則這種樣本稱之為代表性樣本。2024-2-12131/182(2)有偏樣本在人為因素的影響這種情況下的抽取的樣本稱為有偏樣本,是產生抽樣偏差的來源。(3)隨機樣本按隨機原則抽取的樣本。(4)分層樣本(類型樣本)先將總體按某一標誌分成若干組,再從各組中隨機抽樣。

例如:考察全國工商企業時,先按行業分組再抽樣,以避免所選出的樣本集中在某一行業。這種抽樣代表性比較高。2024-2-12132/182(5)整群樣本按群抽樣的樣本。如:考察某市小學生身體發育情況,隨機抽取若干小學,對抽中小學的全體學生逐一考察。(省力省時)(6)系統抽樣按某種規律(如固定的間隔)在總體中抽取樣本的方法。如:按身份證的編號抽取尾數,為了進行居民收入狀況調查。但當總體呈現某種系統規律時(週期律)則不能採用,否則有系統誤差。2024-2-12133/182(四)標誌

標誌是一種名稱,不是具體數字,是對個體某一特徵質的規定。標誌在個體的不同取值叫標誌值。其具體表現是文字值或數值。學習成績分別為80,98,91,86等成績=標誌,分數是標誌值2024-2-12134/182標誌可分為:數量標誌:表明個體數量方面的特徵(如成績)品質標誌:個體屬性方面的特徵(性別)不變標誌(性別);可變標誌(成績)2024-2-12135/182(五)指標反映自然與社會現象總體的數量特徵及其具體數值的量指標包含兩個基本要素:指標概念(名稱)、指標數值指標分為:數量指標與品質指標;總量指標、相對指標和平均指標;實物指標與價值指標;時期指標與時點指標;2024-2-12136/182(六)例題下列標誌中屬於品質標誌的有()

A學歷;B籍貫;C成績;D身高;E職稱;F性別;下列指標中屬於品質指標的有()

A總產量;B畝產量;C播種面積;D價格;E單位產品原材料消耗某公司今年一、二季度職工人數分別為100人和110人,該指標屬於();該公司今年一、二季度銷售額分別為100萬元和110萬元,該指標屬於()

A數量指標;B品質指標;C總量指標;D相對指標;E平均指標;

F實物指標;G價值指標;H時期指標;I時點指標2024-2-12137/182二、抽樣方法1.簡單隨機抽樣(樣本同分佈,抽樣相互獨立)每個個體被抽中的可能性相等。如:抽籤。2.分層隨機抽樣先分組,再分別從各組中簡單隨機抽樣,可增大樣本代表性,推斷結果準確性高,層內差異小,層間差異大。2024-2-12138/1823.整群抽樣將總體分成若干群,在隨機抽一部分群體做樣本,並對這些群體的所有個體全面調查,隨機抽組法與組內普查法的結合。4.系統隨機抽樣法(等距抽樣或機械抽樣)基本思想:對於容量為N的總體,將個體編號從1到N。若要抽取容量為n的樣本,則應先從編號為1到K(K=[N/n])的K個個體中,隨機抽取一個,然後,按照一定的規律,抽取個體,順次得到容量為n的樣本。2024-2-12139/182系統隨機抽樣舉例2024-2-12140/182例題:以下情形屬於何種抽樣方法?1.質檢局對某啤酒公司生產的啤酒進行抽樣檢驗:(1)從12箱中隨機取1箱(2)從12箱中每一箱各隨機取1瓶(3)將12箱打開全部混合後隨機取12瓶2.為了瞭解楊老師授課情況,院長從該班男生和女生中各隨機抽取3人座談。3.為了瞭解本屆畢業研究生學位論文的品質,主管部門對其學號尾數是8的學生所寫論文進行檢查。2024-2-12141/182三、數據的整理與圖形表示(一)分組按一定的變異標誌,將總體分成若干部分。統計分組是分組整理的基礎。可劃分社會經濟現象的類型,研究現象的內部結構及分析現象之間的依存關係。統計分組的要求和基本原則:

A.窮盡互斥;B.上組限不在內;幾個基本概念:上限與下限、開口組與閉口組、組距、組中值2024-2-12142/182思考:某次考試滿分100分,沒有倒扣分題。為分析全班考試成績,下列分組正確的是()A.[0,60],[60,70],[70,80],[80,100]B.(0,60),(60,70),(70,80),(80,100)C.(0,60],(60,70],(70,80],(80,100]D.[0,60),[60,70),[70,80),[80,100)E.[0,60),[60,70),[70,80),[80,100]2024-2-12143/182例題:某公司員工年薪情況如下表,求各組組中值,向上累積與向下累積。.年薪(萬元)人數(人)向上累積向下累積組距組中值4以下104~6306~105010以上102024-2-12144/182答案:.年薪(萬元)人數(人)向上累積向下累積組距組中值4以下1010100234~6304090256~105090604810以上10100104122024-2-12145/182(二)統計圖表1.統計圖(1)條形圖

圖12005年神州公司三個子公司利潤額對比

2024-2-12146/182(2)直方圖2024-2-12147/182(3)圓形圖2024-2-12148/1822024-2-12149/182

環形圖8%36%31%15%7%33%26%21%13%10%

非常不滿意

不滿意

一般

滿意

非常滿意

甲乙兩城市家庭對住房狀況的評價2024-2-12150/182(4)線圖2024-2-12151/182(5)散點圖2024-2-12152/182(6)折線圖2024-2-12153/182小案例32.6%

32.4%

圖1可口可樂與百事可樂市場佔有率對比百事可樂可口可樂2024-2-12154/182思考

某公司加工一批鋼珠,標準直徑為10.0mm,今隨機抽取56個檢測,直徑(mm)為:

10.1,10.3,10.4,9.9,9.9,10.1,10.2,9.8,10.4,10.1,9.9,10.5,10.1,10.0,10.0,9.9,10.2,10.4,10.1,9.9,10.0,10.6,10.7,10.0,10.1,10.0,10.0,9.8,10.2,10.3,9.8,10.0,9.9,10.2,10.1,10.0,10.0,10.3,10.1,10.0,9.8,9.8,10.0,10.5,10.6,9.8,10.3,10.5,9.9,9.8,10.0,10.2,10.0,10.2,9.9,10.1

其生產的這批鋼珠存在問題嗎?為什麼?2024-2-12155/182分析9.75~9.85:7個;9.85~9.95:8個;9.95~10.05:12個;10.05~10.15:9個;10.15~10.25:7個;10.25~10.35:4個;10.35~10.45:3個;10.45~10.55:3個;10.55~10.65:2個;10.65~10.75:1個;2024-2-12156/182根據直方圖分析產生原因(1)分組過多或測量等原因導致。2024-2-12157/182根據直方圖分析產生原因(2)由於人、機器、材料、方法、測量、環境等因素突變導致。2024-2-12158/182根據直方圖分析產生原因(3)將兩組工藝或兩個工人或兩臺不同類、不同工藝條件下的產品混合在一起原因導致。2024-2-12159/1822.統計表1999~2000年城鎮居民家庭抽樣調查資料專案單位1999年2000年

調查戶數平均每戶家庭人口平均每戶就業人口平均每戶就業面平均一就業者負擔人數平均每人全部年收入#可支配收入平均每人消費性支出戶人人%元元元元

400443.141.7756.431.775888.775854.024615.91

4222.03.131.6853.671.866316.816279.984998.00資料來源:《中國統計年鑒2001》,中國統計出版社,2001,第305頁。注:本表為城市和縣城的城鎮居民家庭抽樣調查材料。

附加表頭行標題列標題數字資料基本結構2024-2-12160/182編制規則(1)選擇合適的總標題(2)主賓詞欄各歸其後,相互對應(3)表上、下兩端用粗實線或雙線封口,左右兩端一般不封口(4)列數多時,加設編號(5)數據欄不能有空白2024-2-12161/182統計表舉例表1上海市按GDP計算的三次產業結構(%)資料來源:根據《1998年上海統計年鑒》整理問題:如何製作三線表?(見下頁)1980年1990年1996年1997年GDP100100100100

第一產業3.24.32.52.3

第二產業75.763.854.552.2

第三產業21.131.943.045.52024-2-12162/182問題:如何製作三線表?(演示)表1上海市按GDP計算的三次產業結構(%)資料來源:根據《1998年上海統計年鑒》整理1980年1990年1996年1997年GDP100100100100

第一產業3.24.32.52.3

第二產業75.763.854.552.2

第三產業21.131.943.045.52024-2-12163/182四、數據的描述性指標(一)集中趨勢1.平均數(1)算術平均數(均值)未分組數據:

2024-2-12164/182分組後的數據:xi表示第i組的組中值,fi表示第i組數據的個數均值反映了數據的數量集中的特徵,是數據偶然性、隨機性特徵相互抵消後的穩定數值,反映了一些數據必然的特點。

2024-2-12165/182(2)幾何平均數(geometricmean)未分組數據:

分組後的數據:2024-2-12166/182(3)調和平均數(harmonicmean)未分組數據:分組後的數據:2024-2-12167/182(4)三平均數的大小關係例如:6,12,24的三種平均數為2024-2-12168/182(5)例題①某地區近兩年經濟增長速度分別為21%和44%,求這兩年的平均發展速度。2024-2-12169/182②

某超市有三種水果,價格依次為:6元/斤,4元/斤,3元/斤,趙小姐各買5元。求趙小姐所買得水果的平均價格。2024-2-12170/182③

小王和小李是同班同學,兩人期末考試成績如下,請比較二人的成績優劣。

英語管理學統計學5學分3學分2學分小王808070小李7070902024-2-12171/182兩人的平均成績2024-2-12172/182

解:法1④

已知一等獎120元,二等獎100元,三等獎90元,分別有8人,42人,30人中獎,求平均每人中獎多少?(以下兩種方法哪個正確)法22024-2-12173/182⑤

已知一等獎120元,二等獎100元,三等獎90元,各組獎金總額分別為960元,4200元,2700元,求平均每人中獎多少?解:2024-2-12174/1822.中位數(median)未分組數據中位數是將數據按大小順序排隊後,位置處在最中間的那個數。不受極端值(大、小)的影響。如數據個數為偶數,則最中間兩數的平均數為中位數。問題:一組數據的中位數有幾個?2024-2-12175/182分組數據:

N為數據個數,L、U、fm、i為中位數所在組的下限、上限、頻數與組距,Sm-1、Sm+1為中位數所在組以前各組的累計頻數、中位數所在組以後各組的累計頻數。2024-2-12176/182例題:某班50個學生,一次考試成績分佈如下,求該班學生成績平均值與中位數。(兩種方法哪種正確?)分數人數90以上1070~902060~701560以下52024-2-12177/182解:法1分數組中值人數90以上951080~90852060~80701560以下5052024-2-12178/182分數組中值人數60以下50560~80701580~90852090以上9510法22024-2-12179/182

3.上四分位數*(設為xi),則i=[]

表示約有1/4的數據比xi大,3/4的數據比xi小4.下四分位數*(設為xj)其中j=[]

表示約有3/4的數據比xj大,1/4的數據比xj小。2024-2-12180/1825.眾數(mode)未分組數據:出現次數最多的數值。已分組數據其中:L、U、d分別為眾數組的下限、上限與組距

分別為眾數組與其前後組次數之差問題:一組數據的中位數有幾個?2024-2-12181/182

例1:某MBA班30學生的年齡按上升順序排序為:24、24、25、25、25、25、26、26、26、26、27、27、27、27、27、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论