数据分析与决策概论_第1页
数据分析与决策概论_第2页
数据分析与决策概论_第3页
数据分析与决策概论_第4页
数据分析与决策概论_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、管管 理理 研研 究究 与与 探探 索索-科科 学学 的的 路路 径径-邓胜梁 博士 加拿大柏洛克大学终身教授湖北大学特聘教授 ObservationIdentification of Research ProblemsHypothesesResearch DesignData InterpretationTheoretical FrameworkOr Network of AssociationConstructs, ConceptsOperational DefinitionsData CollectionTheory Refinement(pure research) Or Implem

2、entation (applied research)Analysisof DataObservationIdentification of Research ProblemsHypothesesResearch DesignData InterpretationTheoretical FrameworkOr Network of AssociationConstructs, ConceptsOperational DefinitionsData CollectionTheory Refinement(pure research) Or Implementation (applied rese

3、arch)Analysisof Data火爆的人才招聘会火爆的人才招聘会ObservationIdentification of Research ProblemsHypothesesResearch DesignData InterpretationTheoretical FrameworkOr Network of AssociationConstructs, ConceptsOperational DefinitionsData CollectionTheory Refinement(pure research) Or Implementation (applied research)A

4、nalysisof Data如何在吸引人才上形成优势?你可以接管我的工厂,烧你可以接管我的工厂,烧掉我的厂房,但只要留下掉我的厂房,但只要留下我的那些人,我就可以重我的那些人,我就可以重建建IBMIBM公司。公司。 IBMIBM创史人创史人沃森沃森人才吸引力ObservationIdentification of Research ProblemsHypothesesResearch DesignData InterpretationTheoretical FrameworkOr Network of AssociationConstructs, ConceptsOperational Def

5、initionsData CollectionTheory Refinement(pure research) Or Implementation (applied research)Analysisof Data需求层次理论需求层次理论保健因素保健因素u 公司政策公司政策u 行政管理行政管理u 工作环境工作环境u 安安 全全激励因素激励因素u 成就和认同成就和认同u 挑战和责任挑战和责任u 进步和发展进步和发展不不满满意意没没有有不不满满意意满满意意没没有有满满意意双因素双因素理论理论劳伦斯劳伦斯D阿克曼阿克曼ObservationIdentification of Research Pro

6、blemsHypothesesResearch DesignData InterpretationTheoretical FrameworkOr Network of AssociationConstructs, ConceptsOperational DefinitionsData CollectionTheory Refinement(pure research) Or Implementation (applied research)Analysisof DataObservationIdentification of Research ProblemsHypothesesResearc

7、h DesignData InterpretationTheoretical FrameworkOr Network of AssociationConstructs, ConceptsOperational DefinitionsData CollectionTheory Refinement(pure research) Or Implementation (applied research)Analysisof DataObservationIdentification of Research ProblemsHypothesesResearch DesignData Interpret

8、ationTheoretical FrameworkOr Network of AssociationConstructs, ConceptsOperational DefinitionsData CollectionTheory Refinement(pure research) Or Implementation (applied research)Analysisof Data数据分析与决策 旅游发展研究院旅游发展研究院 宋鸿宋鸿 副教授副教授1399 5611 866 概念框架软件统计学:从数据到结论统计学:从数据到结论吴喜之,中国统计出版社(2006)旅游决策分析方法旅游决策分析方法

9、(Tourism Tourism Analysis:AAnalysis:A Handbook Handbook) Stephen L J Smith著,李天元,徐虹,黄晶译 天津:南开大学出版社,2005多元数据分析多元数据分析 James M.Lattin J.Douglas Carroll Paul E. Green 北京:机械工业出版社,2003计量经济分析方法与建模计量经济分析方法与建模- -EviewEview应用及实例应用及实例 高铁梅,北京:清华大学出版社(2005)随机性随机性规律性规律性现实中的随机性和规律性现实中的随机性和规律性n从中学起,我们就知道自然科学的许多定律,例从

10、中学起,我们就知道自然科学的许多定律,例如物理中的牛顿三定律,物质不灭定律以及化学如物理中的牛顿三定律,物质不灭定律以及化学中的各种定律等等。中的各种定律等等。n但是在许多领域,但是在许多领域,很难用如此确定的公式或论述很难用如此确定的公式或论述来描述一些现象。来描述一些现象。比如,人的寿命是很难预先确比如,人的寿命是很难预先确定的。一个吸烟、喝酒、不锻炼、而且一口长荤定的。一个吸烟、喝酒、不锻炼、而且一口长荤的人可能比一个很少得病、生活习惯良好的人活的人可能比一个很少得病、生活习惯良好的人活得长。得长。n因此,可以说,活得长短是有一定随机性的因此,可以说,活得长短是有一定随机性的(rando

11、mness)。这种随机性可能和人的经历、这种随机性可能和人的经历、基因、习惯等基因、习惯等无数说不清的因素无数说不清的因素都有关系。都有关系。n但是从总体来说,我国公民的平均但是从总体来说,我国公民的平均年龄却是非常稳定的。而且女性的年龄却是非常稳定的。而且女性的平均年龄也稳定地比男性高几年。平均年龄也稳定地比男性高几年。这就是这就是规律性规律性。n一个人可能活过这个平均年龄,也一个人可能活过这个平均年龄,也可能活不到这个年龄,这是可能活不到这个年龄,这是随机的随机的。n但是总体来说,平均年龄的稳定性,但是总体来说,平均年龄的稳定性,却说明了却说明了随机之中有规律性随机之中有规律性。这种。这种

12、规律就是统计规律。规律就是统计规律。 n再如掷骰子。只要没有人在骰子上做手再如掷骰子。只要没有人在骰子上做手脚,你得到脚,你得到6 6点的概率应该是六分之一。点的概率应该是六分之一。得到其他点的概率也是一样。得到其他点的概率也是一样。n得到得到6 6的概率或者机会是可以知道的,但的概率或者机会是可以知道的,但掷骰子的结果还掷骰子的结果还只可能是六个数目之一只可能是六个数目之一。n这个已知的规律就反映了规律性,而得这个已知的规律就反映了规律性,而得到哪个结果则反映了随机性。到哪个结果则反映了随机性。n如果你掷如果你掷10001000次骰子,那么,大约有六次骰子,那么,大约有六分之一的可能会得到分

13、之一的可能会得到6 6;这也是随机性呈这也是随机性呈现有规律的一个体现。现有规律的一个体现。变量变量数据数据信息信息n一节火车车厢有多少坐位一节火车车厢有多少坐位是一个固定的数目,称为是一个固定的数目,称为常数常数(constant)或者常量。或者常量。n但是,开车后,坐在这节但是,开车后,坐在这节车厢的旅客有多少就没准车厢的旅客有多少就没准了。这有随机性。该车厢了。这有随机性。该车厢的乘客数为变量的乘客数为变量(variable)。n一个学校的注册在校男女生一个学校的注册在校男女生比例是固定的,为常量比例是固定的,为常量n但是,该校任意一群学生的但是,该校任意一群学生的男女生比例就不一定和全

14、校男女生比例就不一定和全校的比例一样了,它为变量的比例一样了,它为变量(variable)。n当变量按照随机规律所取的当变量按照随机规律所取的值是数量时该变量称为定量值是数量时该变量称为定量变量或数量变量变量或数量变量(quantitative variable);n因为是随机的,也称为随机因为是随机的,也称为随机变量变量(random variable)。n如身高体重,购买某商品的如身高体重,购买某商品的人数等等人数等等n性别、观点之类的取非数量性别、观点之类的取非数量值的变量就称为定性变量或值的变量就称为定性变量或属 性 变 量 或 分 类 变 量属 性 变 量 或 分 类 变 量(qua

15、litative variable,或,或categorical variable)。n这些定性变量也可以由定量这些定性变量也可以由定量变量来描述,如男女生的数变量来描述,如男女生的数目,持有某观点的人数比例目,持有某观点的人数比例等等。等等。n定性变量只有用数量来描述时,定性变量只有用数量来描述时,才有可能建立数学模型,并使才有可能建立数学模型,并使用计算机来分析。用计算机来分析。n数 据 中 它 们 通 常 用 哑 元数 据 中 它 们 通 常 用 哑 元(dummy variable)代表,比如代表,比如性别用性别用0、1代表,三种收入用代表,三种收入用0、1、2代表代表(或用字母代表)

16、或用字母代表)n有了变量,何谓数据?有了变量,何谓数据?n不同机构调查所得到的北京不同机构调查所得到的北京收入万元以上市民的比例都收入万元以上市民的比例都不一样,这是变量不一样,这是变量n而这些调查产生一些数目,而这些调查产生一些数目,这些数目就是数据这些数目就是数据(data)n数据是关于变量的观测值。数据是关于变量的观测值。n通过数据可验证有关的理通过数据可验证有关的理论或假定。论或假定。n比如通过抽样调查验证美比如通过抽样调查验证美国选民对共和党候选人的国选民对共和党候选人的支持率是否超过支持率是否超过50%n通过抽样,可以检验某批通过抽样,可以检验某批产品是否合格等等产品是否合格等等数

17、据组织类型时间序列数据时间序列数据横截面数据横截面数据混合横截面数据混合横截面数据纵剖面数据纵剖面数据时间序列数据时间序列数据(Time series data set)(Time series data set)横截面数据横截面数据(cross-sectional data set)(cross-sectional data set)混合横截面数据混合横截面数据(pooled cross section)(pooled cross section)由时间序列数据和横截面数据两种成份构成的数据集。纵剖面数据纵剖面数据(panel data set)(panel data set)对相同的横截面

18、单元(如家庭、企业、城市等)在时间轴对相同的横截面单元(如家庭、企业、城市等)在时间轴 上进行的跟综调查数据。上进行的跟综调查数据。n数据与信息又是什么关系数据与信息又是什么关系呢?呢?n数据是信息的载体,信息数据是信息的载体,信息是数据的内容。是数据的内容。变量之间的关系变量之间的关系n现实世界紧密联系的现实世界紧密联系的n人们想知道投资方式和经济效人们想知道投资方式和经济效益之间的关系、旅客人数和经益之间的关系、旅客人数和经济发展之间的关系等等济发展之间的关系等等n不讨论变量之间的关系,就无不讨论变量之间的关系,就无从谈起任何有深度的应用,统从谈起任何有深度的应用,统计的基本概念就仅仅是摆

19、设而计的基本概念就仅仅是摆设而已。已。定量变量间的关系定量变量间的关系n例例1.1广告投入和销售之间的关系。广告投入和销售之间的关系。下表(数据下表(数据ads.txt)显示了某企业的广显示了某企业的广告投入和销售额之间的关系(万元)。告投入和销售额之间的关系(万元)。广告投 售 额706050403020100横坐标代表广告投入,横坐标代表广告投入,而纵坐标代表销售收入。而纵坐标代表销售收入。看得出有何种关系吗?看得出有何种关系吗?n能否从该数据回答下面问题:能否从该数据回答下面问题:n这两个变量是否有关系?这两个变量是否有关系?n如果有,它们的关系是否显著?如果有

20、,它们的关系是否显著?n这些关系是什么关系,能否用数这些关系是什么关系,能否用数学模型来描述?学模型来描述?n这个关系是否带有普遍性?这个关系是否带有普遍性?n这个关系是不是因果关系?这个关系是不是因果关系?变量之间的关系变量之间的关系因果关系因果关系n在可控制的试验中,较容易在可控制的试验中,较容易找到因果关系;比如治疗方找到因果关系;比如治疗方式和疗效的关系等式和疗效的关系等n但是,一般来说,变量之间但是,一般来说,变量之间有关系这个事实并不意味着有关系这个事实并不意味着一定存在明确的因果关系。一定存在明确的因果关系。n比如,北京比如,北京GDP在一年中在一年中是快速增长的,而一个刚是快速

21、增长的,而一个刚出生的巴拿马婴儿在这一出生的巴拿马婴儿在这一年中的体重也是快速增长年中的体重也是快速增长的的n如果画出图来,它们有类如果画出图来,它们有类似线性的关系似线性的关系n但它们显然没有因果关系但它们显然没有因果关系n只要有关系,即使不是因果关只要有关系,即使不是因果关系也不妨碍人们利用这种关系系也不妨碍人们利用这种关系来进行推断。来进行推断。n比如利用公鸡打鸣来预报太阳比如利用公鸡打鸣来预报太阳升起;虽然公鸡打鸣绝对不是升起;虽然公鸡打鸣绝对不是日出的原因日出的原因(虽然打鸣发生在先)虽然打鸣发生在先)n简单的办法(诸如画图)可简单的办法(诸如画图)可以得到一些信息,但不一定以得到一些信息,但不一定能够给出满意的答案能够给出满意的答案n需要更多的工具和手段来进需要更多的工具和手段来进行数值分析得到更加严格和行数值分析得

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论