




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
商务与经济统计AndersonSweeneyWilliamsSlidesbyJohnLoucksSt.Edward’sUniversity商务与经济统计AndersonSweeney第1章
数据与统计数据数据源描述性统计量统计推断计算和统计分析数据挖掘统计实践的准则经济和商务中的应用统计学第1章
数据与统计数据数据源描述性统计量统计推断计算和统计统计提供均值、中位数、百分比、次序等数字特征用以描述商务和经济形势。通过搜集数据、分析整理、展示数据、解释等方式应用于艺术和科学领域统计提供均值、中位数、百分比、次序等数字特征用以描述商务和经商务和经济中的应用会计
经济会计师事务所利用抽样技术进行选择性审计。经济学家利用统计学对未来经济进行预测或者用于经济的其他方面。财务顾问利用市盈率、股息率等指标来指导自己的投资建议。金融商务和经济中的应用会计经济会计师事务所利用抽样技术进行选商务和经济中的应用各种生产中的统计图表用来控制生产过程。
生产超市结账时使用的电子扫描仪功能之一就是搜集销售数据进行研究,新产品上市前,对消费者进行抽样调查了解市场前景。营销商务和经济中的应用各种生产中的统计图表用来控制生产过程。数据和数据集
数据是通过搜集、分析、汇总得到的事实和特征描述,用于了解和解释事实。
为特定的研究而搜集的数据称为该项研究的数据集数据和数据集数据是通过搜集、分析、汇总得到的事实和特征描述
个体是数据来源的实体
变量是对个体感兴趣的特征。
观测值是针对特定个体搜集到的变量的具体值
在一个完整的数据集中,数据总数等于个体数量乘以变量数量个体、变量、观测值n个个体的数据集包含n个观测值个体是数据来源的实体变量是对个体感兴趣的特征。观
股票
年销售额
每股盈余交易所
(百万美元)
(美元)数据、数据集、个体、变量和观测值公司Dataram EnergySouthKeystoneLandCarePsychemedicsNQ 73.10 0.86N 74.00 1.67N 365.70 0.86NQ 111.40 0.33N 17.60 0.13变量个体数据集观测值股票年销售额每股盈余数据、数度量尺度
度量尺度的选择标准是:是否适合用于数据汇总
和统计分析度量尺度决定了数据中包含的信息量
度量尺度包括:名义尺度顺序尺度间隔尺度比率尺度度量尺度度量尺度的选择标准是:是否适合用于数据汇总度量尺度量尺度名义尺度
往往利用数字代码或者非数字型的标签来表示
用于确定个体属性的标签或名称度量尺度名义尺度往往利用数字代码或者非数字型的标签来表示例子:
大学生按照所学专业进行分类,例如教育、人文、
经济等。
学校分类中也可以使用数字代码,例如教育用1表示,人文用2表示,经济用3表示。度量尺度名义尺度例子:度量尺度名义尺度度量尺度顺序尺度
顺序尺度一般用非数字标签或者数字代码表示
当名义数据可以进行排序时,可以用顺序尺度度量尺度顺序尺度顺序尺度一般用非数字标签或者数字代码表示度量尺度顺序尺度例子:
大学生可以按照年级利用非数字型标签来排序,
比如大一、大二、大三或者大四。
也可以用数字标签来表示年级,如1代表大一,
2代表大二,以此类推。度量尺度顺序尺度例子:度量尺度间隔尺度
间隔尺度永远是数字型的数据。
如果数据具有顺序尺度的特征,同时两个顺序之间
有固定的间隔时,可以用间隔尺度来度量。度量尺度间隔尺度间隔尺度永远是数字型的数据。如果数据具有度量尺度间隔尺度
例子:Melissa的SAT考试得分1205,而Kevin得了1090分
Melissa比Kevin高115分。
度量尺度间隔尺度例子:度量尺度比率尺度
如果数据具有间隔尺度的特征,同时两个数值之比是
有意义的,可以用比率尺度度量。
距离、重量、高度、时间等变量通常用比率尺度度量。
比率尺度必须包含零这一数值,在该点上,表明变量
“什么都没有”度量尺度比率尺度如果数据具有间隔尺度的特征,同时两个数值之度量尺度比率尺度
例子:
Melissa在大学中获得了36学分,而Kevin得了72
学分,Kevin获得了Melissa两倍的学分。度量尺度比率尺度例子:
数据可以划分为分类数据和定量数据
统计分析方法往往依赖于数据类型
普遍的,定量数据有更多的统计分析方法可以应用分类数据和定量数据数据可以划分为分类数据和定量数据统计分析方法往往依赖于数分类数据
数据用于识别每一个体的归属,此时是分类数据
通常称为定性数据
通常使用名义或者顺序变量来度量
可以是数值型或者非数值型
统计分析方法的应用比较有限分类数据数据用于识别每一个体的归属,此时是分类数据通常称定量数据
定量数据表示有多少:
离散数据,度量多少个连续数据,度量多少
定量数据永远是数值型数据
对定量数据而言,数学运算是有意义的。定量数据定量数据表示有多少:离散数据,度量多少个连续度量尺度分类数据定量数据数值型数值型非数值型数据名义尺度顺序尺度名义尺度顺序尺度间隔尺度比率尺度度量尺度分类数据定量数据数值型数值型非数值型数据名义尺度顺序截面数据
截面数据是指在同一时点或者近似同一时点搜集
的个体数据集合。
例子:2010年2月,俄亥俄州每个郡被批准的建
设施工数据。截面数据截面数据是指在同一时点或者近似同一时点搜集例子:时间序列数据
时间序列数据是在不同时点搜集的同一个体的
数据集合。
例子:在过去的36个月,每个月俄亥俄州卢卡斯郡批准的建设施工数量数据。时间序列数据时间序列数据是在不同时点搜集的同一个体的例子时间序列数据美国每加仑无铅汽油的平均城市价格Source:EnergyInformationAdministration,U.S.DepartmentofEnergy,May2009.时间序列数据美国每加仑无铅汽油的平均城市价格Source:数据来源已有数据公司内部数据记录:某个部门负责记录数据商业数据库服务:道琼斯公司政府部门数据:美国劳工部行业协会:美国旅游业行业协会数据某些盈利性组织:研究生管理咨询委员会互联网数据:各个公司的网址数据来源已有数据公司内部数据记录:某个部门负责记录数据商业数
记录可利用数据数据来源公司内部数据雇员记录生产记录存货记录销售记录信用记录客户记录姓名、住址、社保账号产品号、产量、直接人工成本直接材料成本。产品号、存货数量、订货量、经济订购批量、折扣表产品号、销售量、区域销售数量、分类客户销售数量客户名称、地址、信用额度、应收账款余额年龄、性别、收入水平、地址、偏好等记录GovernmentAgencySomeoftheDataAvailableDataSourcesDataAvailableFromSelectedGovernmentAgenciesCensusBureauFederalReserveBoardOfficeofMgmt.&Budget/ombDepartmentofCommerceBureauofLaborStatisticsPopulationdata,numberofhouseholds,householdincomeDataonmoneysupply,exchangerates,discountratesDataonrevenue,expenditures,debtoffederalgovernmentDataonbusinessactivity,valueofshipments,profitbyindustryCustomerspending,unemploymentrate,hourlyearnings,safetyrecordGovernmentAgencyStatisticalStudies-ExperimentalDataSourcesInexperimentalstudiesthevariableofinterestisfirstidentified.Thenoneormoreothervariablesareidentifiedandcontrolledsothatdatacanbeobtainedabouthowtheyinfluencethevariableofinterest.Thelargestexperimentalstudyeverconductedisbelievedtobethe1954PublicHealthServiceexperimentfortheSalkpoliovaccine.NearlytwomillionU.S.children(grades1-3)wereselected.StatisticalStudies-ExperimeStatisticalStudies-ObservationalDataSourcesInobservational(nonexperimental)studiesnoattemptismadetocontrolorinfluencethevariablesofinterest.asurveyisagoodexampleStudiesofsmokersandnonsmokersareobservationalstudiesbecauseresearchersdonotdetermineorcontrolwhowillsmokeandwhowillnotsmoke.StatisticalStudies-ObservatDataAcquisitionConsiderationsTimeRequirementCostofAcquisitionDataErrorsSearchingforinformationcanbetimeconsuming.Informationmaynolongerbeusefulbythetimeitisavailable.Organizationsoftenchargeforinformationevenwhenitisnottheirprimarybusinessactivity.Usinganydatathathappentobeavailableorwereacquiredwithlittlecarecanleadtomisleadinginformation.DataAcquisitionConsiderationDescriptiveStatisticsMostofthestatisticalinformationinnewspapers,magazines,companyreports,andotherpublicationsconsistsofdatathataresummarizedandpresentedinaformthatiseasytounderstand.Suchsummariesofdata,whichmaybetabular,graphical,ornumerical,arereferredtoasdescriptivestatistics.DescriptiveStatisticsMostofExample:HudsonAutoRepair ThemanagerofHudsonAutowouldliketohaveabetterunderstandingofthecostofpartsusedintheenginetune-upsperformedinhershop.Sheexamines50customerinvoicesfortune-ups.Thecostsofparts,roundedtothenearestdollar,arelistedonthenextslide.Example:HudsonAutoRepair TExample:HudsonAutoRepairSampleofPartsCost($)for50Tune-upsExample:HudsonAuTabularSummary:
FrequencyandPercentFrequency50-5960-6970-7980-8990-99100-109
2131677
550426321414
10100(2/50)100Parts
Cost($)
FrequencyPercentFrequencyExample:HudsonAutoTabularSummary:
FrequencyGraphicalSummary:Histogram24681012141618PartsCost($)Frequency50-5960-6970-79
80-8990-99100-110Tune-upPartsCostExample:HudsonAutoGraphicalSummary:Histogram2NumericalDescriptiveStatisticsHudson’saveragecostofparts,basedonthe50tune-upsstudied,is$79(foundbysummingthe50costvaluesandthendividingby50).Themostcommonnumericaldescriptivestatisticistheaverage(ormean).Theaveragedemonstratesameasureofthecentraltendency,orcentrallocation,ofthedataforavariable.NumericalDescriptiveStatistStatisticalInference
PopulationSampleStatisticalinferenceCensusSamplesurvey-thesetofallelementsofinterestinaparticularstudy-asubsetofthepopulation-theprocessofusingdataobtainedfromasampletomakeestimatesandtesthypothesesaboutthecharacteristicsofapopulation-collectingdatafortheentirepopulation-collectingdataforasampleStatisticalInferencePopulatiProcessofStatisticalInference1.Populationconsistsofalltune-ups.Averagecostofpartsisunknown.2.Asampleof50enginetune-upsisexamined.Thesampledataprovideasampleaveragepartscostof$79pertune-up.4.Thesampleaverageisusedtoestimatethepopulationaverage.ProcessofStatisticalInfereComputersandStatisticalAnalysisStatisticiansoftenusecomputersoftwaretoperformthestatisticalcomputationsrequiredwithlargeamountsofdata.Tofacilitatecomputerusage,manyofthedatasetsinthisbookareavailableonthewebsitethataccompaniesthetext.ThedatafilesmaybedownloadedineitherMinitaborExcelformats.Also,theExceladd-inStatToolscanbedownloadedfromthewebsite.Chapterendingappendicescoverthestep-by-stepproceduresforusingMinitab,Excel,andStatTools.ComputersandStatisticalAnalDataWarehousingOrganizationsobtainlargeamountsofdataonadailybasisbymeansofmagneticcardreaders,barcodescanners,pointofsaleterminals,andtouchscreenmonitors.Wal-Martcapturesdataon20-30milliontransactionsperday.Visaprocesses6,800paymenttransactionspersecond.Capturing,storing,andmaintainingthedata,referredtoasdatawarehousing,isasignificantundertaking.DataWarehousingOrganizatioDataMiningAnalysisofthedatainthewarehousemightaidindecisionsthatwillleadtonewstrategiesandhigherprofitsfortheorganization.Usingacombinationofproceduresfromstatistics,mathematics,andcomputerscience,analysts“mine
thedata”toconvertitintousefulinformation.Themosteffectivedataminingsystemsuseautomatedprocedurestodiscoverrelationshipsinthedataandpredictfutureoutcomes,…promptedbyonlygeneral,evenvague,queriesbytheuser.DataMiningAnalysisoftheDataMiningApplicationsThemajorapplicationsofdatamininghavebeenmadebycompanieswithastrongconsumerfocussuchasretail,financial,andcommunicationfirms.Dataminingisusedtoidentifyrelatedproductsthatcustomerswhohavealreadypurchasedaspecificproductarealsolikelytopurchase(andthenpop-upsareusedtodrawattentiontothoserelatedproducts).Asanotherexample,dataminingisusedtoidentifycustomerswhoshouldreceivespecialdiscountoffersbasedontheirpastpurchasingvolumes.DataMiningApplicationsTheDataMiningRequirementsStatisticalmethodologysuchasmultipleregression,logisticregression,andcorrelationareheavilyused.Alsoneededarecomputersciencetechnologiesinvolvingartificialintelligenceandmachinelearning.Asignificantinvestmentintimeandmoneyisrequiredaswell.DataMiningRequirementsStaDataMiningModelReliabilityFindingastatisticalmodelthatworkswellforaparticularsampleofdatadoesnotnecessarilymeanthatitcanbereliablyappliedtootherdata.Withtheenormousamountofdataavailable,thedatasetcanbepartitionedintoatrainingset(formodeldevelopment)andatestset(forvalidatingthemodel).Thereis,however,adangerofoverfittingthemodeltothepointthatmisleadingassociationsandconclusionsappeartoexist.Carefulinterpretationofresultsandextensivetestingisimportant.DataMiningModelReliabilityEthicalGuidelinesforStatisticalPracticeInastatisticalstudy,unethicalbehaviorcantakeavarietyofformsincluding:ImpropersamplingInappropriateanalysisofthedataDevelopmentofmisleadinggraphsUseofinappropriatesummarystatisticsBiasedinterpretationofthestatisticalresultsYoushouldstrivetobefair,thorough,objective,andneutralasyoucollect,analyze,andpresentdata.Asaconsumerofstatistics,youshouldalsobeawareofthepossibilityofunethicalbehaviorbyothers.EthicalGuidelinesforStatistEthicalGuidelinesforStatisticalPracticeTheAmericanStatisticalAssociationdevelopedthereport“EthicalGuidelinesforStatisticalPractice”.ProfessionalismResponsibilitiestoFunders,Clients,EmployersResponsibilitiesinPublicationsandTestimonyResponsibilitiestoResearchSubjectsResponsibilitiestoResearchTeamColleaguesThereportcontains67guidelinesorganizedintoeighttopicareas:ResponsibilitiestoOtherStatisticians/PractitionersResponsibilitiesRegardingAllegationsofMisconductResponsibilitiesofEmployersIncludingOrganizations,Individuals,Attorneys,orOtherClientsEthicalGuidelinesforStatistEndofChapter1EndofChapter1商务与经济统计AndersonSweeneyWilliamsSlidesbyJohnLoucksSt.Edward’sUniversity商务与经济统计AndersonSweeney第1章
数据与统计数据数据源描述性统计量统计推断计算和统计分析数据挖掘统计实践的准则经济和商务中的应用统计学第1章
数据与统计数据数据源描述性统计量统计推断计算和统计统计提供均值、中位数、百分比、次序等数字特征用以描述商务和经济形势。通过搜集数据、分析整理、展示数据、解释等方式应用于艺术和科学领域统计提供均值、中位数、百分比、次序等数字特征用以描述商务和经商务和经济中的应用会计
经济会计师事务所利用抽样技术进行选择性审计。经济学家利用统计学对未来经济进行预测或者用于经济的其他方面。财务顾问利用市盈率、股息率等指标来指导自己的投资建议。金融商务和经济中的应用会计经济会计师事务所利用抽样技术进行选商务和经济中的应用各种生产中的统计图表用来控制生产过程。
生产超市结账时使用的电子扫描仪功能之一就是搜集销售数据进行研究,新产品上市前,对消费者进行抽样调查了解市场前景。营销商务和经济中的应用各种生产中的统计图表用来控制生产过程。数据和数据集
数据是通过搜集、分析、汇总得到的事实和特征描述,用于了解和解释事实。
为特定的研究而搜集的数据称为该项研究的数据集数据和数据集数据是通过搜集、分析、汇总得到的事实和特征描述
个体是数据来源的实体
变量是对个体感兴趣的特征。
观测值是针对特定个体搜集到的变量的具体值
在一个完整的数据集中,数据总数等于个体数量乘以变量数量个体、变量、观测值n个个体的数据集包含n个观测值个体是数据来源的实体变量是对个体感兴趣的特征。观
股票
年销售额
每股盈余交易所
(百万美元)
(美元)数据、数据集、个体、变量和观测值公司Dataram EnergySouthKeystoneLandCarePsychemedicsNQ 73.10 0.86N 74.00 1.67N 365.70 0.86NQ 111.40 0.33N 17.60 0.13变量个体数据集观测值股票年销售额每股盈余数据、数度量尺度
度量尺度的选择标准是:是否适合用于数据汇总
和统计分析度量尺度决定了数据中包含的信息量
度量尺度包括:名义尺度顺序尺度间隔尺度比率尺度度量尺度度量尺度的选择标准是:是否适合用于数据汇总度量尺度量尺度名义尺度
往往利用数字代码或者非数字型的标签来表示
用于确定个体属性的标签或名称度量尺度名义尺度往往利用数字代码或者非数字型的标签来表示例子:
大学生按照所学专业进行分类,例如教育、人文、
经济等。
学校分类中也可以使用数字代码,例如教育用1表示,人文用2表示,经济用3表示。度量尺度名义尺度例子:度量尺度名义尺度度量尺度顺序尺度
顺序尺度一般用非数字标签或者数字代码表示
当名义数据可以进行排序时,可以用顺序尺度度量尺度顺序尺度顺序尺度一般用非数字标签或者数字代码表示度量尺度顺序尺度例子:
大学生可以按照年级利用非数字型标签来排序,
比如大一、大二、大三或者大四。
也可以用数字标签来表示年级,如1代表大一,
2代表大二,以此类推。度量尺度顺序尺度例子:度量尺度间隔尺度
间隔尺度永远是数字型的数据。
如果数据具有顺序尺度的特征,同时两个顺序之间
有固定的间隔时,可以用间隔尺度来度量。度量尺度间隔尺度间隔尺度永远是数字型的数据。如果数据具有度量尺度间隔尺度
例子:Melissa的SAT考试得分1205,而Kevin得了1090分
Melissa比Kevin高115分。
度量尺度间隔尺度例子:度量尺度比率尺度
如果数据具有间隔尺度的特征,同时两个数值之比是
有意义的,可以用比率尺度度量。
距离、重量、高度、时间等变量通常用比率尺度度量。
比率尺度必须包含零这一数值,在该点上,表明变量
“什么都没有”度量尺度比率尺度如果数据具有间隔尺度的特征,同时两个数值之度量尺度比率尺度
例子:
Melissa在大学中获得了36学分,而Kevin得了72
学分,Kevin获得了Melissa两倍的学分。度量尺度比率尺度例子:
数据可以划分为分类数据和定量数据
统计分析方法往往依赖于数据类型
普遍的,定量数据有更多的统计分析方法可以应用分类数据和定量数据数据可以划分为分类数据和定量数据统计分析方法往往依赖于数分类数据
数据用于识别每一个体的归属,此时是分类数据
通常称为定性数据
通常使用名义或者顺序变量来度量
可以是数值型或者非数值型
统计分析方法的应用比较有限分类数据数据用于识别每一个体的归属,此时是分类数据通常称定量数据
定量数据表示有多少:
离散数据,度量多少个连续数据,度量多少
定量数据永远是数值型数据
对定量数据而言,数学运算是有意义的。定量数据定量数据表示有多少:离散数据,度量多少个连续度量尺度分类数据定量数据数值型数值型非数值型数据名义尺度顺序尺度名义尺度顺序尺度间隔尺度比率尺度度量尺度分类数据定量数据数值型数值型非数值型数据名义尺度顺序截面数据
截面数据是指在同一时点或者近似同一时点搜集
的个体数据集合。
例子:2010年2月,俄亥俄州每个郡被批准的建
设施工数据。截面数据截面数据是指在同一时点或者近似同一时点搜集例子:时间序列数据
时间序列数据是在不同时点搜集的同一个体的
数据集合。
例子:在过去的36个月,每个月俄亥俄州卢卡斯郡批准的建设施工数量数据。时间序列数据时间序列数据是在不同时点搜集的同一个体的例子时间序列数据美国每加仑无铅汽油的平均城市价格Source:EnergyInformationAdministration,U.S.DepartmentofEnergy,May2009.时间序列数据美国每加仑无铅汽油的平均城市价格Source:数据来源已有数据公司内部数据记录:某个部门负责记录数据商业数据库服务:道琼斯公司政府部门数据:美国劳工部行业协会:美国旅游业行业协会数据某些盈利性组织:研究生管理咨询委员会互联网数据:各个公司的网址数据来源已有数据公司内部数据记录:某个部门负责记录数据商业数
记录可利用数据数据来源公司内部数据雇员记录生产记录存货记录销售记录信用记录客户记录姓名、住址、社保账号产品号、产量、直接人工成本直接材料成本。产品号、存货数量、订货量、经济订购批量、折扣表产品号、销售量、区域销售数量、分类客户销售数量客户名称、地址、信用额度、应收账款余额年龄、性别、收入水平、地址、偏好等记录GovernmentAgencySomeoftheDataAvailableDataSourcesDataAvailableFromSelectedGovernmentAgenciesCensusBureauFederalReserveBoardOfficeofMgmt.&Budget/ombDepartmentofCommerceBureauofLaborStatisticsPopulationdata,numberofhouseholds,householdincomeDataonmoneysupply,exchangerates,discountratesDataonrevenue,expenditures,debtoffederalgovernmentDataonbusinessactivity,valueofshipments,profitbyindustryCustomerspending,unemploymentrate,hourlyearnings,safetyrecordGovernmentAgencyStatisticalStudies-ExperimentalDataSourcesInexperimentalstudiesthevariableofinterestisfirstidentified.Thenoneormoreothervariablesareidentifiedandcontrolledsothatdatacanbeobtainedabouthowtheyinfluencethevariableofinterest.Thelargestexperimentalstudyeverconductedisbelievedtobethe1954PublicHealthServiceexperimentfortheSalkpoliovaccine.NearlytwomillionU.S.children(grades1-3)wereselected.StatisticalStudies-ExperimeStatisticalStudies-ObservationalDataSourcesInobservational(nonexperimental)studiesnoattemptismadetocontrolorinfluencethevariablesofinterest.asurveyisagoodexampleStudiesofsmokersandnonsmokersareobservationalstudiesbecauseresearchersdonotdetermineorcontrolwhowillsmokeandwhowillnotsmoke.StatisticalStudies-ObservatDataAcquisitionConsiderationsTimeRequirementCostofAcquisitionDataErrorsSearchingforinformationcanbetimeconsuming.Informationmaynolongerbeusefulbythetimeitisavailable.Organizationsoftenchargeforinformationevenwhenitisnottheirprimarybusinessactivity.Usinganydatathathappentobeavailableorwereacquiredwithlittlecarecanleadtomisleadinginformation.DataAcquisitionConsiderationDescriptiveStatisticsMostofthestatisticalinformationinnewspapers,magazines,companyreports,andotherpublicationsconsistsofdatathataresummarizedandpresentedinaformthatiseasytounderstand.Suchsummariesofdata,whichmaybetabular,graphical,ornumerical,arereferredtoasdescriptivestatistics.DescriptiveStatisticsMostofExample:HudsonAutoRepair ThemanagerofHudsonAutowouldliketohaveabetterunderstandingofthecostofpartsusedintheenginetune-upsperformedinhershop.Sheexamines50customerinvoicesfortune-ups.Thecostsofparts,roundedtothenearestdollar,arelistedonthenextslide.Example:HudsonAutoRepair TExample:HudsonAutoRepairSampleofPartsCost($)for50Tune-upsExample:HudsonAuTabularSummary:
FrequencyandPercentFrequency50-5960-6970-7980-8990-99100-109
2131677
550426321414
10100(2/50)100Parts
Cost($)
FrequencyPercentFrequencyExample:HudsonAutoTabularSummary:
FrequencyGraphicalSummary:Histogram24681012141618PartsCost($)Frequency50-5960-6970-79
80-8990-99100-110Tune-upPartsCostExample:HudsonAutoGraphicalSummary:Histogram2NumericalDescriptiveStatisticsHudson’saveragecostofparts,basedonthe50tune-upsstudied,is$79(foundbysummingthe50costvaluesandthendividingby50).Themostcommonnumericaldescriptivestatisticistheaverage(ormean).Theaveragedemonstratesameasureofthecentraltendency,orcentrallocation,ofthedataforavariable.NumericalDescriptiveStatistStatisticalInference
PopulationSampleStatisticalinferenceCensusSamplesurvey-thesetofallelementsofinterestinaparticularstudy-asubsetofthepopulation-theprocessofusingdataobtainedfromasampletomakeestimatesandtesthypothesesaboutthecharacteristicsofapopulation-collectingdatafortheentirepopulation-collectingdataforasampleStatisticalInferencePopulatiProcessofStatisticalInference1.Populationconsistsofalltune-ups.Averagecostofpartsisunknown.2.Asampleof50enginetune-upsisexamined.Thesampledataprovideasampleaveragepartscostof$79pertune-up.4.Thesampleaverageisusedtoestimatethepopulationaverage.ProcessofStatisticalInfereComputersandStatisticalAnalysisStatisticiansoftenusecomputersoftwaretoperformthestatisticalcomputationsrequiredwithlargeamountsofdata.Tofacilitatecomputerusage,manyofthedatasetsinthisbookareavailableonthewebsitethataccompaniesthetext.ThedatafilesmaybedownloadedineitherMinitaborExcelformats.Also,theExceladd-inStatToolscanbedownloadedfromthewebsite.Chapterendingappendicescoverthestep-by-stepproceduresforusingMinitab,Excel,andStatTools.ComputersandStatisticalAnalDataWarehousingOrganizationsobtainlargeamountsofdataonadailybasisbymeansofmagneticcardreaders,barcodescanners,pointofsaleterminals,andtouchscreenmonitors.Wal-Martcapturesdataon20-30milliontransactionsperday.Visaprocesses6,800paymenttransactionspersecond.Capturing,storing,andmaintainingthedata,referredtoasdatawarehousing,isasignificantundertaking.DataWarehousingOrganizatioDataMiningAnalysisofthedatainthewarehousemightaidindecisionsthatwillleadtonewstrategiesandhigherprofitsfortheorganization.Usingacombinationofproceduresfromstatistics,mathematics,andcomputerscience,analysts“mine
thedata”toconvertitintousefulinformation.Themosteffectivedataminingsystemsuseautomatedprocedurestodiscoverrelationshipsinthedataandpredictfutureoutcomes,…promptedbyonlygeneral,evenvague,queriesbytheuser.DataMiningAnalysisoftheDataMiningApplicationsThemajorapplicationsofdatamininghavebeenmadebycompanieswithastrongconsumerfocussuchasretail,financial,andcommunicationfirms.Dataminingisusedtoidentifyrelatedproductsthatcustomerswhohavealreadypurchasedaspecificproductarealsolikelytopurchase(andthenpop-upsareusedtodraw
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论