版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
緒論笫一節統計的歷史沿革及統計學的學科性質一、統計的含義含義包括:統計數據處理過程(統計工作或統計活動)、統計數據(統計資料)和統計學。統計是統計數據處理過程、統計數據、統計學的統一體。統計數據處理過程是指對社會現象、經濟現象、自然現象的數據資料進行搜集、整理、分析研究的過程。統計數據是統計工作過程中所取得的各項數字資料和其他與之相聯系的資料的總稱。統計學是闡明如何搜集、整理和分析統計資料的理論與方法的科學。統計學是對統計實踐活動的經驗總結和理論概括。統計三個方面的含義之間存在下列關係:統計數據是統計數據處理過程的成果,統計學是對統計數據處理過程的經驗總結和理論概括,反過來又指導統計數據處理,使統計數據準確可靠。二、統計的歷史沿革統計是適應人類社會實踐活動的需要而產生和發展起來的。原----文字產生之前----“結繩記事”----統計計數活動---文字產生之後------古巴比倫的原始算版-----古埃及的紙草記錄-----古印度的貝多羅葉記錄-----古代中國的甲骨文記錄----統計計數活動日益深入人類社會實踐-------統計計數活動--------統計最初的萌芽。奴--形成---統計也初步形成西元前2000多年的夏禹-----有了人口、土地等記載《尚書》-----有對居民生活條件的調查記錄-----“數量和分組的初步概念已經形成”封----我國的統計已略具規模《商君書》-----強國知十三數,即“境內倉、口(府)之數,壯男、壯女之數,老弱之數,宦士之數,以言談取食者之數,利民之數,馬、牛、芻、槁之數”封-----各個朝代都進行過人口、土地、財產等方面的統計調查-----並建立了一定的統計調查制度。古希臘西元前600年-------人口普查古羅馬西元前----建立了出生、死亡登記制度。近代統計的發展是與資本主義的產生發展同步的17世紀至18世紀-----隨----資本主義的成長--人口、工業、農業的統計登記逐漸形成制度“商業、工業、農業、海關、外貿、物價等方面的統計得到了很大的發展”。隨著統計實踐的發展,歐洲出現了一些統計理論著作在統計學的初創時期,政治算術學派和國勢學派(記述學派)的理論佔據了統治地位。1政治算術學派的創始人是英國人威廉•配弟(W.Petty,1623-1687)和約翰•格蘭特(J.Graunt,1620-1674)。威謙•配弟的代表作是《政治算術》,該書運用大量實際統計資料,對英國、法國、荷蘭三國的國情國力,作了系統的數量對比分析。他的利用實際資料,用數量、重量和尺度來說話的方法,為統計的創立奠定了方法論的基礎。約翰•格蘭特的代表作是《對死亡率公報的自然觀察和政治觀察》,該書對倫敦人口的出生率、死亡率、性別比例作了分類計算和並編制了死亡率表,以死亡率表為依據進行了人口的統計推算預測。2國勢學派(記述學派)的創始人是德國人海•康令(H.Conring,1606-1682)和高•阿亨華爾(G.Arhenlwall,1719-1772)阿亨華爾把拉丁語Status和義大利語Stato引伸為德語Statistika(國勢學、統計學),意思是主要用文字來記述國家應注意的事項的學問。31850年德國人克尼斯(K.G.A.Knies,1821-1897)在《作為獨立科學的統計學》一書中,將國勢學正式命名為國家學,將英國人威廉·配弟和約翰·格郎特創立的政治算術正式命名為Statistika(統計學)41787年英國人齊麥曼(E.A.Zimmeman)把德語Statistika譯成英語Statistics(統計學)。519世紀中葉,隨著統計理論和實踐的發展,又產生了數理統計學派。數理統計學派的創始人是比利時人阿道夫.凱特勒(A.Quetelet,1796-1874)。其代表作有《社會物理學》。凱特勒把概率論引入統計學,使統計方法在準確性方面有了質的躍進20世紀初以英國人費希爾(R.A.Fisher,1890-1962)為代表,將數理統計發展成用隨機樣本推斷有關總體的推斷統計。數理統計學派認為統計學是一門獨立的方法論科學。619世紀下半葉,德國人克尼斯(K.G.A.Knies,1821-1897)和梅爾(G.V.Mayr,1841-1925)在繼承政治算術學派和在凱特勒的影響下創立了社會統計學派,社會統計學派的代表人物還有恩格爾(C.L.E.Engel,1821-1896)社統計學派認為統計學是一門實質性的社會科學620世紀上半葉,在前蘇聯及社會主義國家建立了社會經濟統計學,社會經濟統計學深受德國社會統計學的影響。前蘇聯統計學家認為統計學是一門獨立的社會科學,排斥數理統計學,認為數理統計學是數學的一個分支我們認為------社會經濟統計學認為是經濟領域的統計學------社會經濟統計學、數理統計學和自然科學各領域的統計學確定為統計學的分支認為社會經濟統計學是一門方法論的科學,社會經濟統計學不排斥數理統計方法的運用,數理統計方法應是社會經濟統計學的重要內容本書著重研究社會經濟統計學。三、統計學的學科性質1研究對象(1)
社會經濟統計的研究對象是大量社會經濟現象總體的數量方面,即研究社會經濟現象總體的數量特徵和數量關係(2)社會經濟統計學的研究對象也是大量社會經濟現象總體的數量方面,和社會經濟統計相比,它是對社會經濟現象總體數量方面的間接研究,它的研究對象是社會經濟統計這種調查研究活動的規律和方法它研究如何搜集、整理和分析大量社會經濟現象總體數量方面的規律和方法社會經濟統計學從其性質來講,研究的是方法論,它是一門研究方法論的社會科學2社會經濟統計具有如下特點:(一)數量性由於社會經濟統計的研究對象是大量社會經濟現象的數量方面,因此,數量性就成為社會經濟統計的基本特點。數量性特點具體包含三個方面的內容。
1.數量的多少。即研究現象的規模、大小、水準等。
2.現象間的數量關係。即研究現象的內部結構、比例關係、相關關係等。
3.質與量間的關係。即研究現象質與量互變的界限、研究質與量的統一功行賞(二)總體性由於社會經濟統計的研究對象是社會經濟現象的總體的數量方面,因此總體性就成為社會經濟統計的重要特點。(三)具體性社會經濟統計的研究對象是具體事物的數量方面,不是抽象的量,因此,社會經濟統計具有具體性特點。(四)社會性社會經濟統計以社會經濟現象作為研究對象,有明顯的社會性的特點;社會經濟統計本身也是一種社會實踐活動,更具備社會性的特徵。四、統計的認識過程統計作為一種認識活動,其認識過程可以從兩個方面來理解。一方面,從質與量的關係看,統計的認識過程是從質開始到量,再到質與量的結合另一方面,從個體與總體的關係看,統計的認識過程是從對個體數量的認識開始,再到對總體數量特徵的認識五、統計研究的具體方法主要有大量觀察法、統計分組法、綜合指標法和統計推斷法。(一)大量觀察法大量觀察法是指統計在研究社會經濟現象及其發展變化過程中要從總體上加以觀察,對現象總體的全部或足夠多數的個體進行調查研究並綜合分析,從而反映現象總體的數量特徵。(二)統計分組法統計分組法是根據統計研究的需要和現象內在的特點,按一定標誌,把總體劃分為若干個不同部分或組的一種統計方法。(三)綜合指標法將大量觀察所得的資料進行加工、匯總,就可以得到反映現象總體一般數量特徵的綜合指標,運用各種綜合指標對現象總體的數量方面進行分析,這種分析方法叫綜合指標法。(四)統計推斷法
統計推斷法是根據局部樣本資料,按一定的置信標準,用樣本數據來判斷總體數量特徵的統計分析方法笫二節統計數據處理的步驟六統計數據處理的步驟統計數據處理的步驟有:統計設計、統計調查、統計整理和統計分析。
七、統計的基本職能統計的基本職能是指統計本身所固有的內在功能。統計具有資訊、諮詢、監督三大職能。(一)統計資訊職能統計資訊職能是指統計具有資訊服務的功能,也就是統計通過系統地搜集、整理、分析得到統計資料,在統計資料的基礎上再經過反復提煉篩選,提供大量有價值的、以數量描述為基本特徵的統計資訊,為社會服務。(二)統計諮詢職能統計諮詢職能是指統計具有提供諮詢意見和對策建議的服務功能,也就是指統計部門利用所掌握的大量的統計資訊資源,經過進一步地分析、綜合、判斷,為宏觀、微觀決策,為科學管理提供諮詢意見和對策建議。統計諮詢分為有償諮詢和無償諮詢兩種。統計諮詢應更多地走向市場。(三)統計監督職能統計監督職能是指統計具有揭示社會經濟運行中的偏差,促使社會經濟運行不偏離正常軌道的功能,也就是統計部門以定量檢查、經濟監測、預警指標體系等手段,揭示社會經濟決策和執行中的偏差,使社會經濟決策及其運行按客觀規律的要求進行。(四)統計決策職能統計決策職能是指為了達到某種既定的目標,在統計分析和統計預測的基礎上提出各種行動方案,從中選擇最優方案,執行並回饋的工作過程。第三節統計學中常用的基本概念八、統計總體和總體單位1統計總體統計總體是客觀存在的,具有某種共同性質的個體所組成的整體。
例如,研究全國私營企業的情況,全國的私營企業就構成一個總體。例如,研究某省的零售企業狀況,全省的零售企業就形成一個總體研究某市的零售企業狀況,全市的零售企業就構成一個總體再如,研究某市工傷事故情況,該市工傷事故就構成一個總體。
2構成總體的每個個體就是總體單位例如,全國的私營企業是一個總體,則每個私營企業就是一個總體單位。總體按包含個體的多少可以分為有限總體和無限總體有限總體無限總體例如,生產線上大量連續不斷生產出的某種小件產品,由於時間不斷延續,該種小件產品就構成一個無限總體
統計總體具有三個基本特徵:大量性、同質性和差異性。(一)大量性大量性特徵是指總體應包含足夠多的單位數(二)同質性同質性是指構成統計總體的每個個體必須至少在某一方面具有共同性質,就是這個共同性使這些個體結合成一個整體,同質性是構成總體的基礎。(三)差異性差異性是指構成總體的個體除了至少在某一方面具有共同性質外,在其他方面存在差異例如,全國的私營企業總體,除了都是中國的私營企業這一共同點外,在註冊資本、投資規模、淨利潤、職工人數等等方面存在差異。統計總體和總體單位的概念不是固定不變的,隨著研究目的的改變,原來的總體有可能變為總體單位,原來的總體單位有可能變為總體。例如,研究全國的鋼鐵企業生產情況,寶鋼就是其中的一個總體單位,而當研究寶鋼的經濟效益狀況時,它又成為統計總體了。九、標誌、指標和指標體系標誌是說明總體單位屬性或特徵的名稱全國人口總體,每個人是總體單位,其中某人是一個總體單位,他是男性,這個特徵的名稱叫性別,性別就是一個標誌另外,年齡、民族、文化程度、身高等也是標誌標誌的具體表現是指在標誌名稱之後所列示的屬性或數值在全國人口總體中,性別是個標誌,性別分為男、女,“男”就是性別這個標誌的具體表現,同樣“女”也是性別這個標誌的具體表現在全國人口總體中,身高也是個標誌,各總體單位身高不完全相同,身高可以有1.75m、1.76m等等,“1.75m”就是身高這個標誌的具體表現。
按標誌的性質不同可以分為品質標誌和數量標誌品質標誌是表明事物屬性特徵,只能用文字說明,不能用數值來表示的標誌。性別只能用“男”、“女”兩個文字來表示又如,所有制只能用“國有”、“集體”、“私營”、“合資”來表示數量標誌是表明事物量的特徵,用數值來表示的標誌身高用“1.75m”等數值來表示,身高是數量標誌年齡、工資、產值、利潤、成本等都用數值來表示,且說明總體單位,均為數量標誌數量標誌的具體表現也稱做標誌值標誌按變異情況可分為不變標誌和可變標誌在一個總體中,對於一個標誌來說,如果總體各單位具有相同的標誌具體表現,則該標誌叫不變標誌。例如全國私營企業總體,所有制是不變標誌在一個總體中,對於一個標誌來說,如果總體各單位具有不同的標誌具體表現,則該標誌叫可變標誌。同樣是全國私營企業總體,產值是可變標誌
指標是說明總體的對於指標有兩種不同的理解,一種:認為指標是反映總體數量特徵的概念或範疇。例如,國內生產總值是指標,國民收入、工業總產值、工業增加值、勞動生產率等也是指標。這種理解包涵三要素:指標的含義、指標計算範圍、指標計算方法及計量單位。這種理解是正確的,這種理解用於統計理論和統計設計另一種認為指標是反映總體數量特徵的概念加具體數值。例如1990年我國耕地面積95.7×(43509.4萬畝)是指標。這種理解不僅包涵上述三要素,而且包涵下列要素:指標所屬時間、指標所屬空間、指標數值。這種理解也是正確的,這種理解具體用於統計調查、統計整理、統計分析指標按性質的不同分為數量指標和品質指標數量指標是反映現象總規模、總水準或總數量的統計指標,又稱總量指標。數量指標用絕對數表示例如人口總數、國民生產總值、工業總產值、工資總額、職工總數等均是數量指標品質指標是反映現象本身品質或反映現象強度、密度、工作品質和經濟效果的統計指標,品質指標表明現象的對比關係,品質指標用相對數或平均數表示例如,平均工資、人均收入、人口密度、出勤率、設備利用係數、利潤率等均是品質指標。
標誌和指標既有區別又有聯繫。它們的區別是:
1)標誌說明總體單位的特徵,指標說明總體的特徵。
2)有的標誌可用數值來表示,如數量標誌。有的標誌不能用數值表示,如品質標誌。而所有的指標都可用數值表示。標誌和指標間的聯繫是:
1)數量指標的數值是根據數量標誌的標誌值匯總而來的。例如某企業全部職工總體,每個職工是總體單位,工資是數量標誌,工資總額是數量指標,工資總額是根據每個職工的工資匯總得到的。
2)指標與標誌間存在變換關係。隨著研究目的的改變,原來的總體變為總體單位,原來的指標相應地變為數量標誌;隨著研究目的的改變,原來的總體單位變為總體,原來的數量標誌相應地變為指標。單個指標只能反映現象總體的一個側面或一個方面,不可能反映總體的全面情況,為了揭示總體的全貌,必須把一系列相互聯繫、相互補充的指標結合起來應用。若干個相互聯繫、相互補充的指標結合在一起形成一個整體叫指標體系。指標體系可分為兩大類:基本統計指標體系和專題統計指標體系。基本統計指標體系是指反映國民經濟和社會發展及其各個組成部分基本情況的指標體系。具體又分三個層次:最高層次是反映國民經濟和社會發展的統計指標體系,從經濟上講主要是國民經濟綜合平衡指標體系,還應建立社會指標體系和科技指標體系;中間層次是各地區各部門統計指標體系,這個層次也應該建立中觀經濟綜合平衡指標體系、中觀社會指標體系和中觀科技指標體系;第三是基層統計指標體系,它是指微觀企業、事業單位的統計指標體系。專題統計指標體系是指針對某項社會或經濟問題而制定的專門統計指標體系。例如,就環保問題應建立環保指標體系;就能源問題建立能源統計指標體系,就社會保障問題應建立社會保障指標體系。十、變異和變數變異是指標志的具體表現在總體各單位間的差異。例如在人口總體中,性別是個標誌,男、女是標誌的具體表現,在這個總體中,性別這個標誌的具體表現在總體各單位間是有差異的,這就是變異。同樣在人口總體中,年齡是個標誌,年齡在總體各單位間表現是不同的,有0歲、1歲、2歲、……,這就是變異。變異分為品質變異和數量變異。人口總體中,性別分為男、女是品質變異年齡表現為0歲、1歲、2歲、……,是數量變異全國企業總體中,所有制分為國有、集體、私營和合資是品質變異職工人數具體表現為10人、20人、……是數量變異。可變的數量標誌和所有的統計指標稱作變數,變數的具體取值叫變數值。例如在全國人口總體中,年齡是變數,年齡的具體取值0歲、1歲、2歲、……是變數值又例如在某企業職工總體中,工資是變數,工資的具體取值600元、700元、……是變數值。
變數可以按不同的標準進行分類按變數值是否連續分為離散變數和連續變數離散變數的各個變數值都是按整數位斷開的如職工人數、企業個數、設備台數連續變數的各個變數值是連續不斷的,相鄰兩值間可作無限分割如身高、體重、面積、體積等。變數按性質的不同分為確定性變數和隨機變數確定性變數是指變數值受確定因素影響,其變動方向明確呈上升或下降趨勢隨機變數是指變數值受不確定因素的影響,其變動方向呈現偶然性。第一節數據收集的分類一、統計數據的來源
1、直接來源:調查和科學實驗第一手資料
2、間接來源:公開出版物:《中國統計年鑒》、《中國統計摘要》、《中國社會統計年鑒》、《中國工業經濟統計年鑒》、《中國農村統計年鑒》、《中國人口統計年鑒》、《中國市場統計年鑒》、《世界經濟年鑒》、《國外經濟統計資料》、《世界發展報告》……。網路1、數據收集,又稱統計調查,是指按照預定的數據收集的要求、目的和任務,根據研究對象的特點,採取科學的調查方法,有組織、有計畫地向調查對象搜集有關數據資料及瞭解具體情況的過程。它與一般社會調查有一些區別,數據收集主要著眼於數字資料的搜集,不是搜集個別單位的資料,而是搜集大量單位的資料,並能夠據以匯總、計算、整理,形成說明總體的綜合數據。
二、數據收集的概念2、數據收集的基本要求:精度:最低的抽樣誤差或隨機誤差及時性:在最短的時間裏取得並公佈數據關聯性:滿足用戶決策、管理和研究的需要一致性:保持時間序列的可比性最低成本:以最經濟的方式取得數據1、按數據收集的組織形式不同可分為:
統計報表:又可分為:全面統計報表非全面統計報表專門調查:如:普查、抽樣調查、重點調查、典型調查等2、按數據收集研究的總體範圍不同可分為:
全面調查:普查、全面統計報表非全面調查:如抽樣調查、重點調查、典型調查等三、數據收集的分類3、按登記資料的時間是否連續可分為:
經常性調查一次性調查4、按搜集資料的方式不同可分為:
直接觀察法:如盤點報告法:如統計報表採訪法:又可細分為:詢問法:個別深度訪問調查會自填法:首先要設計好調查問卷或調查表
此外,通訊法也越來越得到廣泛應用,如網上調查
第二節數據收集方案的設計四、數據收集(統計調查)方案由以下幾部分構成:
一、確定調查目的 回答“為什麼調查?”,調查要達到的具體目標。
調查之前必須明確二、確定調查對象和調查單位(回答“向誰調查?”)
1、調查對象:即調查研究的對象,即總體
2、調查單位:需要對之進行調查的單位。可以是調查對象的全部單位(全面調查),也可以是調查的一部分單位(非全面調查)。調查對象
調查單位?
三、確定調查專案和設計調查表(調查內容)
1、調查專案:即統計標誌調查專案數目的確定應貫徹少而精的原則2、調查表:單一表一覽表Q1…………Q2…………Q3…………Q4…………四、方案設計中的其他問題
1、明確調查所採用的方法
2、確定調查時間:包括兩個方面(1)資料所屬的時間(2)調查工作時間:調查工作的起止時間,稱為調查期限。例:會計報表,上市公司年報制度等
3、確定調查地點:通常就是調查單位所在的地點
4、調查的組織與實施細則做好各項準備工作:如調查組織機構設置、調查人員配備、經費、資料等第三節數據收集的組織五、統計報表1、概念:統計報表是定期取得統計資料的主要方法,是按照國家調查檔的統一規定,以一定的表式、報送程式、報送時間自上而下統一佈置、自下而上逐級提供統計資料的一種調查方式,也是一種定期的統計報告制度。是一種具有法律性質的報表制度2、分類:3、優點:資訊量大缺點:靈活性差,資料具有相對的可靠性4、資料來源:原始記錄、統計臺帳、企業內部報表等六、普查1、要點:為特定目的專門組織的非經常性全面調查(1) 通常是一次性或週期性的(2) 一般需要規定統一的標準調查時間(3) 數據的規範化程度較高(4) 應用範圍比較狹窄2、組織形式:(1)設立專門的普查機構。如人口普查(2)不設立專門的普查機構和配備專門的人員。如盤點3、注意事項:(1)選擇合適的普查時期(調查期限)(2)確定標準時點(調查時間)(3)普查專案的一致性七、抽樣調查1、概念:是從總體中隨機抽取一定數量的單位(樣本)進行觀察,根據對這一部分單位觀察的結果(樣本指標)來推算總體數量特徵(總體指標)的一種非全面調查方式。總體樣本2、特點:
(1)隨機原則:機會均等原則(2)數量上的推算:樣本指標總體指標(統計量)(參數)(3)誤差可事先計算(4)具有經濟性、時效性強、適應面廣、準確性高等特點八、重點調查1、概念:是在總體中選擇一部分重點單位進行調查,藉以瞭解總體基本情況的一種非全面調查。2、重點單位:是指單位的數目在全部總體單位數目中只占較少的比重,但其標誌總量在總體的標誌總量中卻占較大的比重的總體單位,即所謂的“重要的少數”。
例:要瞭解我國鋼鐵企業生產情況,只要對少數的幾個大型的鋼鐵企業(如鞍鋼、寶鋼、首鋼等)進行調查,就可瞭解全國鋼產量的基本情況。3、調查結果不能用於推斷總體九、典型調查1、概念:是在對所研究對象進行初步的全面分析的基礎上,從中選擇具有代表性的典型單位,作周密系統的調查,藉以認識事物的本質及其發展變化規律性的一種非全面調查方式。2、特點:(1)首先對總體進行全面分析(2)帶有一定的主觀性3、調查結果不能用於推斷總體第一節數據整理程式一、數據整理的概念數據整理又稱統計整理,就是根據統計研究的目的和任務,將收集取得的大量原始資料進行科學的分類(或分組)、匯總,為數據分析提供條理化、系統化的綜合數據資料的工作過程。有時,為了特定的目的,對已經整理過的數據資料(即次級資料)進行加工,以滿足統計分析的要求,也屬於數據整理工作的範圍。二、數據整理的程式(一)資料審核:1、對原始資料的審核
完整性審核:檢查應調查的單位或個體是否有遺漏;所有的調查專案或指標是否填寫齊全。
準確性審核:邏輯檢查:檢查數據是否真實反映客觀實際情況,內容是否符合實際。
計算檢查:檢查數據是否有錯誤,計算是否正確等。2、對第二手資料的審核:(1)適用性審核弄清楚数据的来源、数据的口径以及有关的背景材料確定這些數據是否符合自己分析研究的需要(2)時效性審核應尽可能使用最新的统计数据(3)確認是否必要做進一步的加工整理(二)統計分組:分類(三)統計匯總:加總,求合計數(四)編制統計表第二節統計分組三、概念
1、概念:總體各組2、分組原則:(1)周延性:即一個不漏(又稱窮舉原則)(2)互斥性:即不能重複(又稱互斥原則)即:要求保持組內資料同質性和組間資料的差異性四、統計分組的作用1、區分社會經濟現象的類型2、研究總體的內部結構3、研究現象之間的依存關係五、分組標誌(分組標準)1、概念:即分組的依據2、選擇:(1)根據統計研究的目的選擇(2)選擇具有本質性的重要標誌(3)結合現象所處的具體條件六、統計分組的種類(一)按分組標誌的性質不同分
1、按品質標誌分組
如:學生按性別分組,企業按所有制性質分組等
2、按數量標誌分組
如:學生按年齡分組,企業按產值分組等(二)按分組標誌的多少不同分
1、簡單分組:對總體只按一個標誌分組。
例:對企業這個總體按所有制性質、規模大小分別分組。(1)(2)國有大型企業民營企業中型其他小型
若干個相互聯繫的簡單分組構成平行分組體系2、複合分組:對同一總體按照兩個或兩個以上的標誌層疊起來進行分組例:
大型國有企業中型小型大型企業民營企業中型小型大型其他經濟類型中型小型在複合分組方法下形成複合分組體系七、統計分組的方法(一)按品質標誌分組
1、選擇品質標誌作為分組標誌
2、確定組數並表示出各組(根據品質標誌的具體表現)
3、把各單位歸入相應的組匯總出各組的單位數(次數)
有的很簡單,如人口按性別分組。有的很複雜(如人口按職業分組),可查相應的專業分類目錄。
(二)按數量標誌分組
1、選擇數量標誌作為分組標誌
2、確定組數、劃定各組的界限(較複雜)
3、把各單位歸入相應的組匯總得出各組的單位數(稱為次數或頻數;也可用相對數表示,稱為頻率)八、分組結果的表示方法
分組後的結果通常用如下形式來表示:這種形式稱為分佈數列(或次數分佈或頻率分佈)
所分得的各組
各組次數(或頻率)
合計
總次數第三節分佈數列九、分佈數列1、概念:在統計分組的基礎上,將總體的各單位按組歸類整理,形成總體單位在各組間的分佈。這種表明總體單位數在各組分配情況的資料稱為次數(頻率)分佈,又稱分佈數列。
例:我國第五次人口普查我國大陸人口年齡分佈:人口按年齡分組人口數(億人)比率(%)14歲以下2.897922.8915——648.879370.1565歲以上0.88116.96
合計12.6583100.002、構成:
由兩部分構成:(1)各組(2)各組次數(或頻率)
3、種類:根據分組標誌的不同可分為:品質分佈數列:P68
數量分佈數列:簡稱為變數數列P69十、變數數列的種類按各組表示方式不同可分為:
1、單項變數數列:每組用一個數表示。適合於離散變數,且變數值較少的情況。這種類似於品質數列的編制,相對比較簡單。P70工人按日產量(件)分組工人數(人)25310432、組距數列:適合於連續變數和變數值較多的離散型變數
學生按成績分組學生數(人)60以下360——70770——802080——90890以上2
合計40十一、組距數列中的有關概念1、組限:有:上限(μ)下限(L)
A、組限的表示方法有:(1)重疊組限:如:10——2020——30
…
(2)不重疊組限:如:10——20
(只適用於離散變數)21——30
…B、組的表示方法:(1)閉口組:上、下限都有(2)開口組:上、下限有一缺一2、組距計算公式:組距(i)=上限–下限種類:根據各組組距是否相等,組距數列可分為:等距數列異距數列表示方法:一般用5、10、20、50、100等類似數字表示。另一相似的概念:全距(R)=最大變數值–最小變數值3、組中值
概念:每組中點的數值計算公式:
對於開口組,需先假定其所缺的上限或下限(假設開口組的組距與其相鄰組的組距相等)。如:
各組
組中值60以下
5560——706570——807580——908590以上
954、組數(K)組數、組距、全距之間存在如下關係:
可用經驗公式來確定:
K=1+3.322lgn
但最佳決定還是依據常識和數列使用的目的而定。十二、變數數列的編制1、排序:排序後:(1)求出全距R
(2)確定變數數列的種類(等距數列或不等距數列)2、確定組距和組數3、劃定各組的界限4、匯總得出各組單位數(次數)例:P72-P75做:某工廠同工種的50名工人完成生產定額百分數(%)資料如下:
838812311011815812114613712016312513612714211812312613815110186821131421081011051251161321381171031141311088711912710511512612511010714113511793
根據上述資料編制變數數列十三分佈數列的表示方法(一)表示法學生按成績分組組中值學生數(人)比率(%)向上累計向下累計工人數比率工人數比率60以下5525.025.040100.060~7065615.0820.03895.070~80751332.52152.53280.080~90851537.53690.01947.590~10095410.040100.0410.0合計—40100.0————計算累計次數方法:1、向上累計:由變數值小的組向大的組累計,累計次數表示該組上限以下(比該組上限小)的組的次數的總和,所以又稱為較小制累計。2、向下累計:由變數值大的組向小的組累計,累計次數表示該組下限以上(比該組下限大)的組的次數的總和,所以又稱為較大制累計。(二)圖示法常用圖形有:次數分佈直方圖次數分佈折線圖次數分佈曲線圖累計次數折線圖餅狀圖(圓形圖)根據上述資料可繪製如下圖形A、直方圖B、折線圖折線圖又稱頻數多邊形圖。對於組距數列,把直方圖中各頂邊的中點用直線連接起來(注意與橫軸的交點)。對於單項變數數列也可以畫次數折線圖。C、累計次數折線圖累計次數折線圖
累計次數折線圖有兩種形狀:或持續增長的或持續減少的。這分別取決於向上累計或向下累計。D、曲線圖:
當變數數列中的組數愈加增多,變數值也非常多時,折線圖會逐步過渡到平滑曲線。頻數分佈曲線圖實質上是對應於連續變數的頻數分佈的函數關係圖。年齡獲獎人數25歲以下25~3030~3535~4040~4545~5050歲以上15347068533728合計305曲線圖常見的類型有:鐘型分佈、J型分佈、U型分佈對稱分佈右偏分佈左偏分佈正J型分佈反J型分佈U型分佈應用:洛侖茲曲線和基尼係數●洛侖茲(Lorenz)曲線是反映社會收入分配平均程度的一種累計百分數曲線,其特點是在縱軸和橫軸上都進行累計。(下凹程度愈大,表明收入分配愈不公平)基尼係數
義大利經濟學家基尼(Gini)根據洛侖茲曲線提出了判斷收入分配平均程度的量化指標。
合理界限0.2~0.3;警戒線0.4;紅線0.6。中國:2003:0.462007:0.469,被稱為亞洲貧富差距最大的國家)
日本:2007:0.249印度:0.368品質數列可繪製的圖形
某城市居民關注廣告類型的頻數分佈表
廣告類型人數(人)比例頻率(%)
商品廣告服務廣告金融廣告房地產廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計2001.000100.0例:為研究廣告市場的狀況,一家廣告公司在某城市隨機抽取200人就廣告問題做了郵寄問卷調查,其中的一個問題是“您比較關心下列哪一類廣告?”
1.商品廣告2.服務廣告3.金融廣告
4.房地產廣告5.招生招聘廣告6.其他廣告1、條形圖
人數(人)5191610211204080120
商品廣告
服務廣告
金融廣告
房地產廣告
招生招聘廣告
其他廣告廣告類型
某城市居民關注不同類型廣告的人數分佈圖2、圓形圖(餅形圖)
其他廣告1.0%
房地產廣告8.0%
商品廣告56.0%
金融廣告4.5%
服務廣告25.5%
招生招聘廣告5.8%某城市居民關注不同類型廣告的人數構成第四節統計匯總十四、概念在分組的基礎上,將總體各單位分別歸入各組,計算各組及總體的單位數,各組及總體的標誌總量,使原始統計資料轉化為綜合統計資料的工作過程。即加總合計的過程。十五、組織形式1、逐級匯總:自下而上逐級匯總如:班組車間廠部2、集中匯總:集中起來,一次匯總廠部車間班組3、綜合匯總:以上兩種方式結合使用十六、技術方法1、手工匯總:常用的有劃記法過錄法折疊法卡片法2、電腦匯總第五節統計表十七統計表的概念
統計表是表示統計資料的表格,在由橫行、縱欄交叉結合而成的表格上,它能系統地組織和合理地安排大量數字資料。
十八、統計表的結構1997~1998年城鎮居民家庭抽樣調查資料專案單位1997年1998年
一、調查戶數二、平均每戶家庭人口數三、平均每戶就業人口數四、平均每人全部收入五、平均每人實際支出消費性支出非消費性支出六、平均每人居住面積戶人人元元元元平方米378903.191.835188.544945.874185.64755.9411.90390803.161.805458.345322.954331.61987.1712.40
資料來源:《中國統計摘要1999》,中國統計出版社,1999,第79頁。
橫行標題數字資料總標題縱欄標題主詞賓詞從內容來看,一張統計表由兩部分構成:1、主詞:即統計表所要說明的對象。即橫行標題。2、賓詞:即用來說明統計表所要說明的對象,包括用來說明對象的有關標誌或指標的名稱(即縱欄標題)及其具體數值(即數字資料)。十九、統計表的種類根據主詞是否經過分組及分組方法不同,可分為:
1、簡單表:主詞未分組
2、簡單分組表:主詞經過簡單分組
3、複合分組表:主詞經過複合分組即主詞的三種設計方法簡單表
我国城市居民家庭基本情况表(2002年)主要指標單位數值
平均每戶家庭人口平均每戶就業人口平均每個就業者負擔數平均每人全部年收入平均每人可支配收入平均每人消費性支出人人人元元元3.041.581.928177.407702.806029.88●簡單分組表中國人口年齡結構狀況(單位:%)年齡組1953年1964年1982年1990年2000年0―14歲15―64歲65歲以上36.359.34.440.755.73.633.661.54.927.766.75.622.970.17.0●複合分組表
我國社會福利主要費用情況(單位:億元)專案1998199920002001(一)優撫對象補助金額國家支出集體供給(二)農村傳統救濟金額國家支出集體供給(三)城鄉各種福利院支出國家支出集體供給68.032.435.629.87.022.820.210.39.991.451.140.328.57.920.623.113.79.4
107.660.746.931.78.323.428.719.09.7
108.169.538.6
29.512.117.440.526.414.1合計118.0143.0168.0178.1二十、統計表賓詞設計1、簡單設計:賓詞平行排列如表3-11P882、複合設計:賓詞層疊排列如表3-12P89第一節章綜合指標分類一綜合指標經過統計整理→就可以得到反映社會經濟現象總體數量特徵的統計指標,這就是綜合指標統計上常用綜合指標對社會經濟現象的數量方面進行分析,這種分析方法叫綜合指標法
綜合指標分類第一類是反映社會經濟現象總規模、總水準的綜合指標,即總量指標,其表現形式為絕對數。第二類是反映社會經濟現象之間數量聯繫和數量對比關係的綜合指標,即相對指標,其表現形式為相對數。第三類是反映社會經濟現象某一數量標誌一般水準的綜合指標,即平均指標,其表現形式為平均數。第四類是反映各個標誌值的變動範圍或離散程度的變異指標,變異指標中的平均差、標準差、方差,從計算方式看,也可認為是特殊形式的平均指標。第五類是通過與正態分佈相比較來描述次數分佈特徵的的形狀指標,形狀指標中的偏度、峰度,從計算方式看,也可認作為特殊形式的相對指標。前三者綜合指標反映集中的趨勢;變異指標反映離中的趨勢;形狀指標反映分佈的對稱程度和尖峭程度。第二節集中趨勢指標反映集中趨勢的指標包括:總量指標\相對指標和平均指標.二、總量指標是反映現象在一定條件下總體總量、總規模、總水準的綜合指標。特點:(1)只有有限總體才能計算總量指標(2)數值隨研究範圍的大小而增加或減少(3)最基本的指標,是計算其他指標的基礎總量指標種類(一)按反映的內容不同分為1、總體單位總量-----總體單位數之和2、總體標誌總量-----標誌值之和
例:某企業有500名職工,某月工資總額為100萬元總體單位總量總體標誌總量(二)按反映的時間狀況不同可分為:1、時期指標—反映現象在一段時期內活動過程總結果的總量指標----工總\鋼總量\商零售總額2、時點指標----現象在某一特定時間點上狀況的總量指標---期末職工人數\人口數\牲畜存欄頭數
時期指標特點
時點指標特點連續計數只能間斷計數各期數值可累加累加無意義數值大小與時期長短成正相關數值大小與時點間隔的長短無直接關係(三)按計量單位不同可分為
1實物指標:以實物單位計量的總量指標—反映使用價值自然計量單位------臺、人、輛度量衡單位------公斤、噸、米標準實物單位-----將發熱量不同的煤折算為標準煤
------將不同含量的化肥折算為含量100%的化肥2、價值指標:用貨幣單位計量的總量指標,如國內生產總值、商品銷售總額、總成本等----高度綜合能力,能把不同事物通過貨幣單位直接加總3、勞動指標:有工時、工日。一般僅在單位內部使用,如開展勞動競賽三、相對指標是採用對比的方法,反映現象之間數量對比關係和聯繫程度的綜合指標。表現形式------是相對數,具體表現為:(1)無名數:無計量單位,用%、‰、係數、倍數等表現(2)複名數:主要用於強度相對數,表明事特的強度、密度和普遍程度,如人口密度----人/平方公里、人均國民生產總值------元/人、人均糧食產量----公斤/人四、相對指標的計算(一)計畫完成相對指標1、計算公式:
例:某企業去年實現工業增加值500萬元,今年計畫比去年增長10%,實際增長20%,問該企業今年的工業增加值計畫完成如何?2、作用(1)檢查計畫執行情況對於長期計畫有專門的方法A、水準法例:某企業產量五年計劃實際執行情況如下,設第五年計畫產量為45(萬噸)年份一二三四五上下一二三四一二三四實際產量303217191010111212121313B、累計法:例:某企業基建投資額五年計劃如下:年份一二三四五計畫數100100100100100實際數1201251251300(2)預測計畫執行情況(即計畫進度)例:某企業2005年計畫實現工業總產值160萬元,一、二季度分別實現工業總產值42萬元、44萬元。
據此可預測,按這樣的進度進行下去可超額完成計畫。P111例4.2例4.3例4.4(二)結構相對指標計算公式:例:某城市有5000個企業比重(%)其中:全民企業3000個60集體企業1000個20其他企業1000個20P113例5(三)比例相對指標計算公式:
如上例:某城市有5000個企業比重(%)其中:全民企業3000個60集體企業1000個20其他企業1000個20則這三類企業之間存在3:1:1的比例關係。P114例4.6,例4.7,例4.8計算公式:例:2005年蘇州市人均可支配收入為14000元,南京市為11000元,則:蘇州市人均可支配收入為南京市的1.27倍。P115例4.9例4.10例4.11(四)比較相對指標---同一時間不同總體(五)強度相對指標強度相對指標是指兩個性質不同但有一定聯繫的總量指標對比所形成的綜合指標,其表明現象的強度、密度和普遍程度。如:人口密度,人均GNP、很多財務比率等計算公式:計量單位表現為兩種形式:一種是複名數,即雙重計量單位。在計算這種強度相對指標時,由於其分子與分母的計量單位在計算時無法約去,故計算後仍保留對比雙方的單位,如人口密度用“人/平方公里”表示,人均國民生產總值用“元/人”表示;另一種是無名數,即無計量單位。在計算這種強度相對指標時,由於其分子與分母的計量單位相同,在計算時已約去,故計算後其無單位,一般用千分數、百分數表示,如:人口出生率用千分數來表示。注意點:人口自然增長率,死亡率、人均GNP等是強度相對指標。強度相對數有正、逆兩種指標,一般視哪一個指標更能清楚地說明所研究的問題而加以使用,如研究人口密度時,應使用正指標。P117例4.12---4.16(六)動態相對指標計算公式:常用的有:發展速度、增長速度等不同時期同一現象比較動態相對數強度相對數比較相對數部分與部分比較部分與總體比較實際與計畫比較比例相對數結構相對數計畫完成相對數不同現象比較不同總體比較同一時期比較同類現象比較同一總體中六種相對數指標的比較五、計算和應用相對指標的原則1、正確選擇對比的基礎(即分母)2、保證分子、分母的可比性3、注意相對指標與總量指標結合運用4、多個相對指標結合運用習題:已知某公司下屬三個企業某年下半年產值計畫及計畫執行情況如下:要求:(1)通過計算填寫表中空缺(2)指出上表包含哪幾種相對指標六、平均指標(一)概念是在同質總體中,把某一數量標誌在總體各單位間的差異抽象化,表明其一般水準的綜合指標。如:學生成績平均分工人工資平均工資(二)作用1、可作為判斷事物的一種標準或參考2、通過對比某一現象在不同時間下的平均指標值,可以揭示現象發展變化的趨勢和規律3、通過平均指標來分析現象之間的依存關係4、利用平均指標可以進行推算和估計(三)種類數值平均數:算術平均數---簡單算術平均數
---加權算術平均數調和平均數幾何平均數位置平均數:中位數眾數I算術平均數1、概念:算術平均數是計算平均指標的最基本、最簡單的方法,其基本公式為:2、計算公式:根據所掌握資料的不同,其計算方法有兩種:(1)簡單算術平均數:根據未分組資料計算例4.18:某班組有8名工人,月獎金分別為700元、800元、900元、1000元、700元、1000元、1000元、1100元。則,該班組平均月獎金為:P123(2)加權算術平均數:根據分組資料計算分子:總體標誌總量=∑組標誌總量=∑xf
分母:總體單位總量=∑f其中:f權數對於組距數列,x用每組的組中值,這樣計算出來的平均數只是一個近似值例4.19:P124例4.20P125例4.21P126例4.22P1283、算術平均數的數學性質(1)各個變數值與算術平均數的離差總和為零(2)各個變數值與算術平均數的離差平方和為最小值。II調和平均數(H)
與算術平均數沒有本質區別,是算術平均數的變形。是根據變數值x的倒數計算的,又稱為倒數平均數。1、簡單調和平均數:未分組資料步驟:(1)
(2)
(3)
(4)2、加權調和平均數:將算術平均數公式變形,得:例:某商店銷售三批同種商品,資料如下:例4.24P132例4.25P133例4.26P134III幾何平均數(G)
前面兩種方法的前提條件是變數值之間相互獨立,否則,就該用幾何平均法。一般可用來計算平均速度、平均比率等。1、簡單幾何平均數:未分組資料2、加權幾何平均數:分組資料【例】一位投資者持有一種股票,1996年、1997年、1998年和1999年收益率分別為4.5%、2.0%、3.5%、5.4%。計算該投資者在這四年內的平均收益率。平均收益率=103.84%-1=3.84%例4.27P136例4.28P137IV中位數()概念:處於中間位置的那個變數值計算步驟:1、排序2、找中間位置:未分組資料:(n+1)/2
分組資料:∑f/23、計算中位數數值:對於組距數列,要用近似公式計算下限公式:上限公式:例4.30P139例4.31P139例4.32P141V眾數()1、概念:出現次數最多,出現得最頻繁的那個變數值。2、計算:組距數列情況下近似公式:下限公式:上限公式:例4.34P143眾數、中位數與算術平均數的關係:左偏分佈均值
中位數
眾數對稱分佈
均值=中位數=眾數右偏分佈眾數
中位數
均值三者關係取決於總體內次數分佈的狀況:當次數分佈呈正態分佈時:三者相等當次數分佈呈右偏分佈時:眾數<中位數<算術平均數當次數分佈呈左偏分佈時:算術平均數<中位數<眾數皮爾遜經驗公式(當次數分佈呈適度偏斜狀況時):眾數、中位數與算術平均數的關係:1、必須在同質總體中計算2、選擇適當的計算方法3、用組平均數補充說明總平均數4、用分佈數列補充說明總平均數七、平均指標的計算與應用原則習題:
2、某局所屬15個企業的有關資料如下:計算該局的平均勞動生產率1、某市居民家庭收入資料如下:根據上述資料,計算職工家庭月收入的算術平均數。第三節離中趨指標反映離中趨勢指標包括極差、平均差、標準差、方差和離散係數等指標。八標誌變異指標例:有甲、乙兩組人的身高資料如下:平均身高()甲:160、160160乙:130、190160可見,用平均指標只能說明共性,無法說明差異性的大小。標誌變異指標就是反映總體各單位差異大小的指標。I、概念是反映總體各單位標誌值差異程度的綜合指標。平均指標反映現象的集中趨勢標誌變異指標反映現象的離中趨勢II、作用1、是衡量平均指標代表性大小的尺度如:上例兩者關係:標誌變異指標值越大,平均指標的代表性越小;標誌變異指標值越小,平均指標的代表性越大;2、反映社會經濟活動過程的均衡性、節奏性的好壞。例:有甲、乙兩個車間一季度產量資料如下:1月2月3月月平均產量標誌變異指標甲:10101010=0乙:5151010>0可見,甲車間生產的均衡性、節奏性較好。III、種類根據比較的標準不同,可將標誌變異指標分為3類。1.以標誌值之間相互比較的方式來說明變異情況屬於這類指標的有全距、分位差等。這類指標計算簡單,但易受極端變數值的影響,只能粗略地反映現象的標誌變異程度。2.以平均數為比較標準來說明標誌變異情況屬於這類指標的有平均差、標準差,以及在這些指標的基礎上計算的說明標誌變異相對程度的各種變異係數。它們都是說明標誌值對於平均數的離散程度。3.以正態分佈為標準來說明分配數列的偏離情況屬於這類指標的有偏度和峰度,前者表明分佈曲線的偏斜程度,後者表明分佈曲線的尖峭程度的。IV、計算(一)全距(極差)(R)
計算公式:R=最大變數值–最小變數值優點:簡明易懂缺點:1、只反映極端值之間的差異程度2、易受極端值的影響所以,全距不常用。例:有5名工人的日產量分別為2、7、8、8、10件在實際工作中,極差可以用於檢查產品品質的穩定性和進行品質控制。在正常生產的條件下,產品品質穩定,極差在一定範圍內波動;若極差超過給定的範圍,就說明有不正常情況產生。但極差受到極端值的影響大,測定結果往往不能反映數據的實際離散程度。(二)平均差(A.D)1、概念:是各變數值與算術平均數的離差絕對值的算術平均數,即平均離差。2、計算:
A、未分組情況下:①求算術平均數②求x與算術平均數的離差③求離差的絕對值④求平均離差B、分組情況下:(三)標準差()1、未分組資料:2、分組資料:
方差的簡便演算法需要指出的是,是總體標準差,而樣本標準差。當樣本較大時,由於幾乎等於,因此常用公式代替公式來計算樣本標準差S,並用於估計總體標準差。在小樣本的情況下,較為總體標準差的更優良的估計量。
用以上三種標誌變異指標衡量平均指標的代表性時,是有前提條件的。只有當被比較的兩個平均數相等時才能用,否則不然。
例:有兩組人身高資料如下:成年組:161、163、165、167、169幼兒組:73、74、75、76、77試比較哪組人的身高更均勻些?解:這兩組人的平均身高分別為:成年組=165cm幼兒組=75cm平均差:成年組=2.4cm幼兒組=1.2cm(四)方差的數學性質1.變數與其算術平均數計算的方差小於變數與任意數計算的方差公式:這一性質還可表述為標誌值對其算術平均數的標準差為最小。2.變數的方差等於變數平方的平均數減變數平均數的平方公式:利用這一性質,可以進行標準差的簡捷計算。(五)離散係數概念:反映相對差異程度,通過絕對指標與相應的算術平均數對比求
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- AI智慧安防解决方案
- 风电场箱变安装施工方案优化研究
- 2024至2030年中国自然风格卫浴设备数据监测研究报告
- 2024至2030年中国跳时录像机数据监测研究报告
- 2024至2030年中国毛球胸花数据监测研究报告
- 2024至2030年中国水印瓦当对联数据监测研究报告
- 2024至2030年中国往复锯调速电路板数据监测研究报告
- 2024至2030年铜制开关带插座项目投资价值分析报告
- 2024至2030年蝎毒项目投资价值分析报告
- 矿山开采爆破安全施工方案
- 施工成本控制员岗位职责
- 2021-2022学年北京市房山区九年级(上)期中数学试卷【含解析】
- DB11∕1450-2017 管道燃气用户安全巡检技术规程
- 室上性心动过速-医学课件
- 《第4课 数据的安全》参考教案1
- 药品经营质量管理综合规范试题及答案
- 体育公园项目成本测算
- 人教版数学二年级上册第8单元《数学广角 搭配(一)》教学设计
- Java Web程序设计智慧树知到期末考试答案章节答案2024年青岛职业技术学院
- 《用字母表示数》 单元作业设计
- 国有企业岗位劳动合同模板
评论
0/150
提交评论