版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、整理ppt统统计计软软件件和和R语语言言装了装了R没有?没有?整理ppt一个广泛接受的统计定义为:一个广泛接受的统计定义为:统计统计是用以收集是用以收集数据数据、分析分析数据数据和由和由数据数据得得出结论的一组概念、出结论的一组概念、原则和方法原则和方法.整理ppt这个定义决定了统计的命运:这个定义决定了统计的命运:和数学及音乐不同和数学及音乐不同, 统计统计不能欣赏自己不能欣赏自己, 它不为实它不为实际服务就际服务就没有存在必要没有存在必要统计必须统计必须为各个领域服务为各个领域服务统计必须和统计必须和数据数据打交道打交道因此因此,统计必须和统计必须和计算机计算机结合结合整理ppt搞搞“理论
2、统计理论统计”是否是否用不着动手搞数据呢用不着动手搞数据呢?如果倒退如果倒退几十年几十年就可以就可以.整理ppt如果没有应用背景如果没有应用背景文章没人要文章没人要, 基金无人给基金无人给. 现在一些人即使瞎编也要编现在一些人即使瞎编也要编出一个应用背景来出一个应用背景来.纯纯理论统计理论统计存在吗?存在吗?整理ppt统计和计算机统计和计算机 现代生活已离不开计算机了。现代生活已离不开计算机了。但最早使用计算机的是统计。但最早使用计算机的是统计。最初的计算机最初的计算机仅仅是为科学计仅仅是为科学计算而建造的。大型计算机的最算而建造的。大型计算机的最早一批用户就包含统计。早一批用户就包含统计。而
3、现在统计仍然是进行数字计而现在统计仍然是进行数字计算最多的用户。算最多的用户。整理ppt统计和计算机统计和计算机 计算机现在早已脱离了仅有计算计算机现在早已脱离了仅有计算功能的单一模式,而成为功能的单一模式,而成为百姓生百姓生活的一部分活的一部分。 计算机的使用,也从过去必须学计算机的使用,也从过去必须学会计算机语言到只需要会计算机语言到只需要“傻瓜式傻瓜式”地点击鼠标。结果也从单纯的数地点击鼠标。结果也从单纯的数字输出到包括漂亮的表格和图形字输出到包括漂亮的表格和图形的各种形式。的各种形式。整理ppt统计软件统计软件统计软件的发展,也使得统统计软件的发展,也使得统计从统计学家的圈内游戏变计从
4、统计学家的圈内游戏变成了大众的游戏。成了大众的游戏。只要输入数据,点几下鼠标,只要输入数据,点几下鼠标,做一些选项,马上就得到令做一些选项,马上就得到令人惊叹的人惊叹的漂亮结果了漂亮结果了。整理ppt统计软件统计软件是否傻瓜式的统计软件使用是否傻瓜式的统计软件使用可以代替统计课程了?可以代替统计课程了?当然不是。当然不是。数据的整理和识别,方法的数据的整理和识别,方法的选用,计算机输出结果的理选用,计算机输出结果的理解都不象使用傻瓜相机那样解都不象使用傻瓜相机那样简单可靠。简单可靠。整理ppt统计软件的问题统计软件的问题诸如法律和医学的软件都有不少诸如法律和医学的软件都有不少警告,不时提醒你去
5、咨询专家。警告,不时提醒你去咨询专家。这是注意饭碗的律师和大夫的高这是注意饭碗的律师和大夫的高明之处。明之处。但统计软件则不那么负责。只要但统计软件则不那么负责。只要数据格式无误、方法不矛盾而且数据格式无误、方法不矛盾而且不用零作为除数就一定给你结果,不用零作为除数就一定给你结果,而且而且没有任何警告没有任何警告。可能统计学家缺乏商业头脑。可能统计学家缺乏商业头脑。整理ppt统计软件的问题统计软件的问题另外,统计软件另外,统计软件输出的结果太多输出的结果太多;即使是同样的方法,不同软件输即使是同样的方法,不同软件输出的内容还不一样;有时同样的出的内容还不一样;有时同样的内容名称也不一样。内容名
6、称也不一样。这就使得使用者大伤脑筋。即使这就使得使用者大伤脑筋。即使统计学家也不一定能解释所有的统计学家也不一定能解释所有的输出。输出。因此,就应该特别留神,明白自因此,就应该特别留神,明白自己是在干什么。己是在干什么。不要在得到一堆不要在得到一堆毫无意义的垃圾之后还沾沾自喜。毫无意义的垃圾之后还沾沾自喜。 整理pptdata test;input x;cards;1231760run;proc univariate freq normal;run;随意键入几行随意键入几行SAS语句和语句和5个数目个数目.得到下面结果得到下面结果,一共一共50多个数目多个数目(你能够解释多少你能够解释多少?你
7、需要你需要多少多少?). 整理ppt The SAS System 15:33 Friday, September 12, 2003 1Univariate ProcedureVariable=X Moments Quantiles(Def=5) N 5 Sum Wgts 5 100% Max 60 99% 60 Mean 16.6 Sum 83 75% Q3 17 95% 60 Std Dev 25.12568 Variance 631.3 50% Med 3 90% 60 Skewness 1.899804 Kurtosis 3.563057 25% Q1 2 10% 1 USS 3903
8、 CSS 2525.2 0% Min 1 5% 1 CV 151.3595 Std Mean 11.23655 1% 1 T:Mean=0 1.477322 Pr|T| 0.2136 Range 59 Num = 0 5 Num 0 5 Q3-Q1 15 M(Sign) 2.5 Pr=|M| 0.0625 Mode 1 Sgn Rank 7.5 Pr=|S| 0.0625 W:Normal 0.726472 PrW 0.0197 Extremes Lowest Obs Highest Obs 1( 1) 1( 1) 2( 2) 2( 2) 3( 3) 3( 3) 17( 4) 17( 4) 6
9、0( 5) 60( 5) Frequency Table Percents Percents Value Count Cell Cum Value Count Cell Cum 1 1 20.0 20.0 17 1 20.0 80.0 2 1 20.0 40.0 60 1 20.0 100.0 3 1 20.0 60.0原始的原始的5个数目清楚个数目清楚, 还还是这是这50多个数目清楚多个数目清楚?这些输出都有意义吗这些输出都有意义吗?整理ppt实际上实际上 对于一个统计数据,如果选择对于一个统计数据,如果选择“傻瓜傻瓜”软件适合该数据的选软件适合该数据的选项的全部输出,那么项的全部输出,那么
10、 其中可能包含(很多,甚至多其中可能包含(很多,甚至多数)没有意义的结果数)没有意义的结果(比如(比如SPSS中的对数线性模型、非参中的对数线性模型、非参数检验中的多重相关样本的检数检验中的多重相关样本的检验等等,各种回归中的适合正验等等,各种回归中的适合正态样本的检验)态样本的检验)整理ppt而且而且这些众多的输出,给了那些这些众多的输出,给了那些诸如检验中的诸如检验中的“少数服从多少数服从多数数”的的“创新者创新者”以似是而以似是而非的非的“论据论据”。许多许多“傻瓜傻瓜”软件的输出找软件的输出找不到确切数学背景。只有使不到确切数学背景。只有使用编程软件才能够核对其真用编程软件才能够核对其
11、真实意义。实意义。整理ppt统计软件的种类统计软件的种类统计软件的种类很多。统计软件的种类很多。有些功能齐全,有些价格便有些功能齐全,有些价格便宜;有些容易操作,有些需宜;有些容易操作,有些需要更多的实践才能掌握。要更多的实践才能掌握。还有些是专门的软件,只处还有些是专门的软件,只处理某一类统计问题。理某一类统计问题。最常见有几种。最常见有几种。 整理ppt统计软件的种类统计软件的种类SPSS:这是一个很受欢迎的这是一个很受欢迎的统计软件;统计软件;它容易操作,它容易操作,输出漂亮,输出漂亮,功能齐全,功能齐全,价格合理。价格合理。对于非统计工作者是很好的对于非统计工作者是很好的选择。选择。整
12、理ppt统计软件的种类统计软件的种类 Excel:严格说来不是统计软件,严格说来不是统计软件,但作为数据表格软件,必然有一定但作为数据表格软件,必然有一定统计计算功能。统计计算功能。 注意,多数装注意,多数装Office时没有装数据时没有装数据分析的功能,画图功能都具备分析的功能,画图功能都具备(虽虽然不好看然不好看)。 对于简单分析,对于简单分析,Excel还算方便,还算方便,但随着问题的深入,就不那么但随着问题的深入,就不那么“傻傻瓜瓜”,需要很麻烦地使用函数,甚,需要很麻烦地使用函数,甚至根本没有相应的方法了。至根本没有相应的方法了。整理ppt统计软件的种类统计软件的种类 SAS:这是功
13、能这是功能非常非常齐全的软件;齐全的软件; 美国政府政策倾斜美国政府政策倾斜(“权威性权威性”) 许多美国公司使用。许多美国公司使用。 价格不菲价格不菲,每年交费每年交费.即使赠送即使赠送,条条件苛刻件苛刻 SAS公司傲慢无礼公司傲慢无礼 尽管现在已经尽量尽管现在已经尽量“傻瓜化傻瓜化”,仍然需要一定的训练才可以进入。仍然需要一定的训练才可以进入。 对于基本统计课程则不那么方便。对于基本统计课程则不那么方便。整理ppt统计软件的种类统计软件的种类 S-plus:这是:这是统计学家统计学家喜爱的软件。喜爱的软件。 功能齐全,功能齐全, 图形漂亮图形漂亮 有不断加入有不断加入的各个方向统计学家编写
14、的统的各个方向统计学家编写的统计软件包。也可以自己加入算法计软件包。也可以自己加入算法. 强大而又方便的编程功能强大而又方便的编程功能,使得研究人员,使得研究人员可以编制自己的程序来实现自己的理论和可以编制自己的程序来实现自己的理论和方法。方法。 它也在进行它也在进行“傻瓜化傻瓜化”以争取顾客。但主以争取顾客。但主要以其要以其方便的编程方便的编程为顾客所青睐。为顾客所青睐。 在在R软件之前软件之前是是统计学家统计学家的首选软件。的首选软件。 但是对于不会编程者但是对于不会编程者,不那么不那么“傻瓜傻瓜”整理ppt统计软件的种类统计软件的种类 R软件:软件:免费的免费的,志愿者管理的软件。志愿者
15、管理的软件。 其编程语言与其编程语言与S-plus所基于的所基于的S语言一样,语言一样, 编程方便,语言灵活,图形功能强大编程方便,语言灵活,图形功能强大 有不断加入的各个方向统计学家编写的统计软件有不断加入的各个方向统计学家编写的统计软件包。包。也可以自己加入自己算法的软件包也可以自己加入自己算法的软件包. 从网上可以不断更新和增加有关的软件包、数据从网上可以不断更新和增加有关的软件包、数据和程序。可以使用其他软件编制的程序。和程序。可以使用其他软件编制的程序。 可以通过网上服务把程序变成机器语言可以通过网上服务把程序变成机器语言 这是这是发展最快发展最快的软件,受到世界上统计师生的欢的软件
16、,受到世界上统计师生的欢迎。迎。是用户量增加最快的统计软件是用户量增加最快的统计软件。 对于一般非统计工作者来说,主要问题是它没有对于一般非统计工作者来说,主要问题是它没有“傻瓜化傻瓜化”。(后面对后面对R语言还要专门介绍语言还要专门介绍)整理ppt其他有关软件其他有关软件 Minitab:这个软件是很方便的功能强大这个软件是很方便的功能强大而又齐全的软件,也已经而又齐全的软件,也已经“傻瓜化傻瓜化”,在我国用的不如在我国用的不如SPSS与与SAS那么普遍。那么普遍。 Statistica:也是功能强大而齐全的也是功能强大而齐全的“傻傻瓜化瓜化”的软件,在我国用的也不如的软件,在我国用的也不如
17、SAS与与SPSS那么普遍。那么普遍。 Eviews:这是一个主要处理回归和时间这是一个主要处理回归和时间序列的软件。序列的软件。 Systat: 已经被已经被SPSS购买而消失购买而消失 GAUSS:这是一个很好用的统计软件,这是一个很好用的统计软件,许多搞经济的喜欢它。主要也是编程功许多搞经济的喜欢它。主要也是编程功能强大。目前在我国使用的人不多。能强大。目前在我国使用的人不多。整理ppt其他有关软件其他有关软件 MATLAB:这也是应用于各个领域的以编这也是应用于各个领域的以编程为主的软件,在工程上应用广泛。程为主的软件,在工程上应用广泛。编程编程类似于类似于S和和R。但是统计方法不多。
18、但是统计方法不多。 FORTRAN:这是应用于各个领域的历史这是应用于各个领域的历史很长的非常优秀的编程软件,功能强大,很长的非常优秀的编程软件,功能强大,有大量数学软件包及一定的统计软件包。有大量数学软件包及一定的统计软件包。计算速度比前面介绍的都快得多。但需要计算速度比前面介绍的都快得多。但需要编程和编译。操作不那么容易。编程和编译。操作不那么容易。 C/C+: 是许多软件是许多软件,诸如诸如SAS的基础的基础;但没但没有软件包有软件包,编程不方便编程不方便.整理ppt使用傻瓜软件的问题使用傻瓜软件的问题.无法无法任意取出任意取出计算过程中产生的计算过程中产生的任何任何中间结果中间结果;
19、;只能输出软件规定只能输出软件规定的输出的输出. .无法在中间无法在中间插入任何算法插入任何算法. . 无法实现软件所无法实现软件所没有的没有的计算计算. .无法无法实现任何方法或计算方面的创新实现任何方法或计算方面的创新. .是输入输出皆有限制的是输入输出皆有限制的黑盒子黑盒子. .用语句的任何计算用语句的任何计算( (即使即使1+1=2) 1+1=2) 都需类似八股文的都需类似八股文的 “花架子花架子”. .整理ppt搞统计是否搞统计是否不需要不需要学习编程语言,学习编程语言,可以不学习可以不学习, ,如果你如果你搞纯粹数学推导的搞纯粹数学推导的, ,只搞只搞“理论理论”, ,不面对数据不
20、面对数据, , 不用计算机不用计算机觉得岁数太大觉得岁数太大, ,学不会学不会“非傻瓜非傻瓜”的计算的计算不想有创新不想有创新, ,仅使用现成方法套用仅使用现成方法套用想永远依赖会编程的学生或别的想永远依赖会编程的学生或别的什么人什么人整理ppt但如果你要创新但如果你要创新你需要反复试验你的新方法你需要反复试验你的新方法需要用各种数据来检验你的需要用各种数据来检验你的新方法新方法需要把你的方法和老方法进需要把你的方法和老方法进行比较行比较需要介绍自己的新方法需要介绍自己的新方法使用编程语言不可避免使用编程语言不可避免整理ppt没有任何别的选择没有任何别的选择整理ppt现代统计学家都自己编程现代
21、统计学家都自己编程, ,比如比如 Brockwell & Davis (时间序列时间序列) Bruce & Gao (小波分析小波分析) Bickel, et al. (非线性回归非线性回归) Hastie (广义可加模型广义可加模型) Silverman (非参数密度估计非参数密度估计) McCullagh & Nelder (广义线性模型广义线性模型) Hardell 、 Marron、范剑青、范剑青(非参数回归非参数回归) Diggle , et al. (纵向数据纵向数据) .整理ppt毫无例外,没有任何毫无例外,没有任何新的重要统计方法是新的重要统计方法是利用
22、诸如利用诸如SAS或或 SPSS等傻瓜软件产等傻瓜软件产生的。生的。整理ppt多数多数SAS或或 SPSS等等的新统计方法软件包,的新统计方法软件包,是改写统计学家通过是改写统计学家通过自己编程所发展的方自己编程所发展的方法而来的。法而来的。整理ppt在美国,很难想象一在美国,很难想象一个统计学研究生不会个统计学研究生不会使用编程语言使用编程语言整理ppt使用什么软件编程呢?使用什么软件编程呢? SAS、SPSS、Minitab等也有程序,等也有程序,但很难学,不好记,也没有任何普遍但很难学,不好记,也没有任何普遍性和规律性。性和规律性。 而而S (S-plus,R)、Matlab、Gauss
23、、Fortran、C (C+)、Pascal、Basic等等语言有很多共性。容易举一反三。语言有很多共性。容易举一反三。 有些具有统计软件包,对统计学家则有些具有统计软件包,对统计学家则很方便。特别是很方便。特别是S-plus软件、软件、R软件和软件和Gauss软件。软件。整理ppt使用编程软件容易吗?使用编程软件容易吗? 以以R软件为例软件为例. 非常好学,极易入门非常好学,极易入门 基本功能简单,和写公式一样基本功能简单,和写公式一样 能在一个小时学会基本运算语句能在一个小时学会基本运算语句 在一天内学会编写函数在一天内学会编写函数(子程序子程序)和和利用软件包利用软件包. 往往困难的反而
24、是统计内容本身往往困难的反而是统计内容本身整理pptSAS专家专家很难实现下面很难实现下面并非复杂并非复杂的运算的运算 考虑考虑6060个观测值的回归个观测值的回归, , 其中其中X和和Y=2+3X1 1-2X2+e e随机产生随机产生, ,X1来自来自U(10,20), X2来自来自U(-5,-8), e e来自来自N(0,1),n=60. 回归回归20次次, 每一次回归之后把每一次回归之后把x15的值的值在目前的基础上加在目前的基础上加0.1个原始的个原始的x15值值, 输出残差输出残差e5和矩阵和矩阵P=X(XX)-1X的第的第5个对角线元素个对角线元素h5的值的值,并分别点出这并分别点
25、出这20个个h5和和e5的散点图于一张图中的散点图于一张图中; ; 计算这计算这20个个h5和和e5的的相关系数相关系数. .整理ppt而对于而对于R或者或者S-plus初学者可很快用下面几行初学者可很快用下面几行来解决来解决( (不用任何软件包不用任何软件包):): x1=rnorm(60,10,20);x2=runif(60,-8,-5);x=cbind(1,x1,x2);y=2+3*x1-2*x2+rnorm(60);h=NULL;e=h;i=1;while (i=20)P=x%*%solve(t(x)%*%x)%*%t(x); h=c(h,diag(P)5);e=c(e,(y-P%*%
26、y)5);x5,1=x5,1+x15*0.1;i=i+1;par(mfrow=c(1,2);plot(h);plot(e);cor(h,e)整理ppt510150.81.0Indexh51015200.00.51.0Indexe结果为结果为它们的相关系数为它们的相关系数为-0.9486753整理pptR-语言语言/软件软件整理ppt R免费免费 R 资源公开资源公开(不是黑盒子不是黑盒子,也不是吝啬鬼也不是吝啬鬼) R可以在可以在UNIX, Windows和和Macintosh运行运行. R 有优秀的有优秀的内在帮助系统内在帮助系统. R有优秀的有优秀的画图功能画图功能
27、学生能够轻松地学生能够轻松地转转到商业支持的到商业支持的 S-Plus程序程序(如果需要使用商业软件如果需要使用商业软件) R语言有一个语言有一个强大的强大的,容易学习容易学习的语法的语法,有许多内在的统计函数有许多内在的统计函数.整理ppt 通过用户通过用户自编程序自编程序, R语言很容易语言很容易延延伸和扩大伸和扩大. 它就是这样成长的它就是这样成长的. R 是计算机编程语言是计算机编程语言. 类似于类似于UNIX语言语言,C语言语言,Pascal,Gauss语言等语言等. 对于熟练的编程者对于熟练的编程者, 它将觉得该语它将觉得该语言言比其他语言更熟悉比其他语言更熟悉. 而对计算机初学者
28、而对计算机初学者, 学习学习R语言语言使得使得学习下一步的其他编程不那么困难学习下一步的其他编程不那么困难. 那些傻瓜软件那些傻瓜软件(SAS,SPSS等等)语言的语言的语法则完全不同语法则完全不同.整理pptR的缺点的缺点不如不如S-Plus在编辑输出在编辑输出的画图那样好的画图那样好没有商业支持没有商业支持 (但有网但有网上支持上支持) 需要编程需要编程, 不傻瓜不傻瓜.整理pptR的历史的历史 S语言在语言在1980年代后期在年代后期在AT&T实验室开发实验室开发. R 项目由项目由Auckland 大学统计系大学统计系的的Robert Gentleman和和Ross Ihaka
29、于于1995年开始的年开始的. 它很快得到广泛用户的欢迎它很快得到广泛用户的欢迎. 目目前它是由前它是由R核心发展团队维持核心发展团队维持;它它是一个由志愿者组成的工作努力是一个由志愿者组成的工作努力的国际团队的国际团队整理pptR里面有什么里面有什么? 整理pptPackages (每个都有大量数据和可(每个都有大量数据和可以读写修改的函数以读写修改的函数/程序)程序)base The R base packageboot Bootstrap R (S-Plus) Functions (Canty)class Functions for classificationcluster Funct
30、ions for clustering (by Rousseeuw et al.)ctest Classical Testseda Exploratory Data Analysisforeign Read data stored by Minitab, SAS, SPSS, .grid The Grid Graphics PackageKernSmooth Functions for kernel smoothing for Wand & Jones (1995)lattice Lattice Graphicslqs Resistant Regression and Covarian
31、ce EstimationMASS Main Library of Venables and Ripleys MASSmethods Formal Methods and Classesmgcv Multiple smoothing parameter estimation and GAMs by GCV整理pptPackages (继续)继续) modreg Modern Regression: Smoothing and Local Methodsmva Classical Multivariate Analysisnlme Linear and nonlinear mixed effec
32、ts modelsnls Nonlinear regressionnnet Feed-forward neural networks and multinomial log-linear modelsrpart Recursive partitioningspatial functions for kriging and point pattern analysissplines Regression Spline Functions and Classesstepfun Step Functions, including Empirical Distributionssurvival Sur
33、vival analysis, including penalised likelihood.tcltk Interface to Tcl/Tktools Tools for Package Development and Administrationts Time series functions整理ppt所有这些所有这些Packages都是在都是在base package上添加的上添加的 Base包含所有固有的应用和数据包含所有固有的应用和数据 而其他的而其他的packages包含各统计学包含各统计学家自己发展的方法和数据。家自己发展的方法和数据。 希望你是下一个加盟这些希望你是下一个加盟
34、这些packages的作者之一。的作者之一。整理ppt赋值和运算赋值和运算 z = rnorm(1000000,4,0.1) median(z) “=”可以用可以用“-”代替代替xy-w简单数学运算有简单数学运算有+,-,*,/,%*%,%等等等等整理ppt序列和向量序列和向量 z=seq(-1,10,length=100) z=seq(-1,10, len=100) z=seq(10,-1,-1) z=10:-1 x=rep(3,1:3) x=rep(3:5,1:3) x 1 3 4 4 5 5 5 x=rep(c(1,10),c(4,5) w=c(1,3,x,z);w3整理ppt分布和产生
35、随机数分布和产生随机数 正态分布正态分布: pnorm(1.2,2,1);dnorm(1.2,2,1); qnorm(.7,2,1);rnorm(10,0,1)#rnorm(10) t分布分布:pt(1.2,1);dt(1.2,2);qt(.7,1);rt(10,1) 此外还有此外还有指数分布、指数分布、F分布、分布、“卡方卡方”分布、分布、Beta分布、二项分布、分布、二项分布、Cauchy分布、分布、Gamma分布、几何分布、超几何分布、对分布、几何分布、超几何分布、对数正态分布、数正态分布、Logistic分布、负二项分布、分布、负二项分布、Poisson分布、均匀分布、分布、均匀分布、
36、Weibull分布、分布、Willcoxon分布等分布等 变元可以是向量变元可以是向量!整理ppt向量运算向量运算 x=rep(0,10);z=1:3;x+z 1 1 2 3 1 2 3 1 2 3 1 Warning message: longer object length is not a multiple of shorter object length in: x + z x*z 1 0 0 0 0 0 0 0 0 0 0 Warning message: longer object length is not a multiple of shorter object length
37、in: x * z rev(x) z=c(no cat,has ,nine,tails) z1=no cat 1 TRUE整理ppt向量名字和向量名字和append x=1:3;names(x)=LETTERS1:3 x A B C 1 2 3 append(x,runif(3),after=2) A B C 1.0000000 2.0000000 0.3107987 0.7505149 0.5752226 3.0000000 整理ppt向量赋值向量赋值 z=1:5 z7=8;z 1 1 2 3 4 5 NA 8 z=NULL zc(1,3,5)=1:3; z 1 1 NA 2 NA 3 rn
38、orm(10)c(2,5) z-c(1,3) #去掉第去掉第1、3元素元素. z(length(z)-4):length(z) #最后五个元素最后五个元素.整理ppt向量的大小次序向量的大小次序 z = s a m p l e ( 1 : 1 0 0 , 1 0 ) ; z#比较比较sample(1:100,10,rep=T) 1 75 68 28 42 17 21 96 34 69 47 order(z) 1 5 6 3 8 4 10 2 9 1 7 zorder(z) 1 17 21 28 34 42 47 68 69 75 96 sort(z) 1 17 21 28 34 42 47 6
39、8 69 75 96 which(z=max(z)#给出下标给出下标整理pptMatrix x=matrix(runif(20),4,5) x ,1 ,2 ,3 ,4 ,51, 0.7983678 0.04607601 0.04555323 0.8594483 0.730895002, 0.6559851 0.79562222 0.02948270 0.1453364 0.795528383, 0.6759171 0.56193147 0.48286653 0.2419931 0.560699884, 0.1183701 0.80652627 0.49405167 0.6523137 0.08
40、345406 x=matrix(1:20,4,5);x ,1 ,2 ,3 ,4 ,51, 1 5 9 13 172, 2 6 10 14 183, 3 7 11 15 194, 4 8 12 16 20 x=matrix(1:20,4,5,byrow=T);x ,1 ,2 ,3 ,4 ,51, 1 2 3 4 52, 6 7 8 9 103, 11 12 13 14 154, 16 17 18 19 20整理ppt一些简单函数一些简单函数 max,min,length,mean,median, fivenum,quantile,unique,sd,var,range,rep,diff,sort
41、,order,sum,cumsum,prod,cumprod,rev,print,sample,seq,exp,pi整理ppt矩阵的行和列矩阵的行和列(子集子集) nrow(x); ncol(x);dim(x)#行列数目行列数目 x=matrix(rnorm(24),4,6) xc(2,1),#第第2和第和第1行行 x,c(1,3) #第第1和第和第3列列 x2,1 #第第2,1元素元素 xx,10,1 #第第1列大于列大于0的元素的元素 sum(x,10) #第第1列大于列大于0的元素的个数的元素的个数 sum(x,10&x,30|x,1.51,1 #第第1中小于中小于.51或者或者
42、相相应于第应于第2列中大于列中大于0的元素的元素(“或或”) x!x,2, , =, =, !=;&, |, ! x=rnorm(10) all(x0);all(x!=0);any(x0);(1:10)x0 x=sample(1:7,5,rep=T);unique(x)整理ppt矩阵的转置和逆矩阵矩阵的转置和逆矩阵 x=matrix(runif(9),3,3);x ,1 ,2 ,31, 0.6747652 0.9954731 0.75245022, 0.3090199 0.2390141 0.24729613, 0.5102675 0.9515505 0.6082803 t(x) ,1
43、 ,2 ,31, 0.6747652 0.3090199 0.51026752, 0.9954731 0.2390141 0.95155053, 0.7524502 0.2472961 0.6082803 solve(x) # solve(a,b)可以解可以解ax=b方方程程 ,1 ,2 ,31, -12.313293 15.125819 9.0823002, -8.459725 3.627898 8.9898643, 23.563034 -18.363808 -20.037986整理ppt警告警告:计算机中的计算机中的0是什么是什么? x%*%solve(x) ,1 ,2 ,31, 1.00
44、0000e+00 -9.454243e-17 -3.911801e-162, 5.494737e-16 1.000000e+00 3.248270e-163, -3.018419e-16 1.804980e-15 1.000000e+00 要用线性代数的知识来判断诸如有要用线性代数的知识来判断诸如有多少非零特征根等问题多少非零特征根等问题.假定假定v是特是特征 值 组 成 的 向 量征 值 组 成 的 向 量 , 不 能 用 诸 如不 能 用 诸 如sum(v!=0) 等方法来判断非零特征等方法来判断非零特征根的数目根的数目!整理pptMatrix & Array x=array(ru
45、nif(20),c(4,5); x ,1 ,2 ,3 ,4 ,51, 0.5474306 0.2362356 0.687007107 0.4036998 0.52558392, 0.8234363 0.4922711 0.960554564 0.4704976 0.13278703, 0.1861151 0.8461655 0.390523424 0.2202575 0.40576074, 0.8117521 0.5375946 0.004505845 0.4821567 0.7644741 is.matrix(x)1 TRUE x1,2 x1, x,2 dim(x)#得到维数得到维数(4,5
46、)整理pptArray x=array(runif(24),c(4,3,2) is.matrix(x) #可由可由dim(x)得到维数得到维数(4,3,2)1 FALSE x, , 1 ,1 ,2 ,31, 0.3512615 0.7270611 0.0090555222, 0.1444965 0.2527673 0.6979770273, 0.6658176 0.6638542 0.7737475424, 0.4258436 0.4168940 0.634235148, , 2 ,1 ,2 ,31, 0.3664152 0.9633497 0.56280062, 0.3466645 0.50
47、36830 0.15429863, 0.4552553 0.1289775 0.84230174, 0.1074899 0.3841463 0.7648297整理pptArray的子集的子集 x=array(1:24,c(4,3,2) xc(1,3), , 1 ,1 ,2 ,31, 1 5 92, 3 7 11, , 2 ,1 ,2 ,31, 13 17 212, 15 19 23整理ppt矩阵乘法及行列运算矩阵乘法及行列运算 x=matrix(1:30,5,6);y=matrix(rnorm(20),4,5) y%*%x ,1 ,2 ,3 ,4 ,5 ,61, -3.231808 -8.13
48、791204 -13.044017 -17.950121 -22.856225 -27.7623302, -14.072030 -39.33640851 -64.600787 -89.865165 -115.129543 -140.3939213, -1.750057 -0.02764783 1.694761 3.417170 5.139578 6.8619874, 5.862412 9.78064218 13.698872 17.617103 21.535333 25.453563 apply(x,1,mean)1 13.5 14.5 15.5 16.5 17.5 apply(x,2,sum
49、)1 15 40 65 90 115 140 apply(x,2,prod)1 120 30240 360360 1860480 6375600 17100720整理pptArray的维运算的维运算 x=array(1:24,c(4,3,2) apply(x,1,mean) 1 11 12 13 14 apply(x,1:2,sum) ,1 ,2 ,31, 14 22 302, 16 24 323, 18 26 344, 20 28 36 apply(x,c(1,3),prod) ,1 ,21, 45 46412, 120 55443, 231 65554, 384 7680整理ppt矩阵与向
50、量之间的运算矩阵与向量之间的运算 sweep(x,1,1:5,*) ,1 ,2 ,3 ,4 ,5 ,61, 1 6 11 16 21 262, 4 14 24 34 44 543, 9 24 39 54 69 844, 16 36 56 76 96 1165, 25 50 75 100 125 150 x*1:5 sweep(x,2,1:6,+) ,1 ,2 ,3 ,4 ,5 ,61, 2 8 14 20 26 322, 3 9 15 21 27 333, 4 10 16 22 28 344, 5 11 17 23 29 355, 6 12 18 24 30 36整理pptArray和矩阵和矩
51、阵/向量向量/array之间的运算之间的运算 z=array(1:24,c(2,3,4)#注意排列次序注意排列次序 z, , 1 ,1 ,2 ,31, 1 3 52, 2 4 6, , 2 ,1 ,2 ,31, 7 9 112, 8 10 12, , 3 ,1 ,2 ,31, 13 15 172, 14 16 18, , 4 ,1 ,2 ,31, 19 21 232, 20 22 24整理pptArray和矩阵和矩阵/向量向量/array之间的运算之间的运算 sweep(z,1,1:2,-), , 1 ,1 ,2 ,31, 0 2 42, 0 2 4, , 2 ,1 ,2 ,31, 6 8 1
52、02, 6 8 10, , 3 ,1 ,2 ,31, 12 14 162, 12 14 16, , 4 ,1 ,2 ,31, 18 20 222, 18 20 22整理pptArray和矩阵和矩阵/向量向量/array之间的运算之间的运算 sweep(z,c(1,2),matrix(1:6,2,3),-), , 1 ,1 ,2 ,31, 0 0 02, 0 0 0, , 2 ,1 ,2 ,31, 6 6 62, 6 6 6, , 3 ,1 ,2 ,31, 12 12 122, 12 12 12, , 4 ,1 ,2 ,31, 18 18 182, 18 18 18整理ppt外积外积(产生矩阵或
53、产生矩阵或array) outer(1:2,rep(1,2) ,1 ,21, 1 12, 2 2 outer(1:2,matrix(rep(1,6),3,2), , 1 ,1 ,2 ,31, 1 1 12, 2 2 2, , 2 ,1 ,2 ,31, 1 1 12, 2 2 2整理pptList(set of objects) list可以是任何对象的集合可以是任何对象的集合(包括包括lists) z=list(1:3,Tom=c(1:2, a=list(R,letters1:5),w=hi!) z1;z2;z$T;z$T$a2;z$T3;z$T$wattributes(z)#属性属性!$na
54、mes1 Tom attributes(matrix(1:6,2,3)$dim1 2 3整理ppt矩阵矩阵,array及其维名字及其维名字 x=matrix(1:12,nrow=3,dimnames=list(c(I,x=matrix(1:12,nrow=3,dimnames=list(c(I,II,III),paste(X,1:4,sep=)II,III),paste(X,1:4,sep=) X1 X2 X3 X4I 1 4 7 10II 2 5 8 11III 3 6 9 12 y=array(1:12,c(3,2,2),dimnames=list(c(Iy=array(1:12,c(3,
55、2,2),dimnames=list(c(I , I I , I I I ) , p a s t e ( X , 1 : 2 , I I , I I I ) , p a s t e ( X , 1 : 2 sep=),paste(Y,1:2, sep=)sep=),paste(Y,1:2, sep=), , Y1 X1 X2I 1 4II 2 5III 3 6, , Y2 X1 X2I 7 10II 8 11III 9 12整理pptdata.frame x=matrix(1:6,2,3) x=as.data.frame(x);xV1 V2 V31 1 3 52 2 4 6 x$V21 3 4
56、 x$V21 3 4 attributes(x)$names1 V1 V2 V3$s1 1 2$class1 data.frame整理pptdata.frame names(x)=c(TOYOTA,GM,HUNDA) s(x)=c(2001,2002) x TOYOTA GM HUNDA2001 1 3 52002 2 4 6 x$GM 1 3 4整理pptdata.frame attach(x) GM 1 3 4 detach(x) GM Error: Object GM not found整理ppt直接手工输入和编辑数据直接手工输入和编辑数据 直接敲入直接敲
57、入:x=c(1,2,7,8,) 或者或者 x=scan() 1 2 7 8 .(以以“Enter”两次来结束两次来结束) fix(x)(通过编辑修改数据通过编辑修改数据)整理pptCategorical dataA survey asks people if they smoke or not. The data is Yes, No, No, Yes, Yesx=c(Yes,No,No,Yes,Yes)table(x);xfactor(x)整理pptBarplot:Suppose, a group of 25 people are surveyed as to their beer-drin
58、king preference. The categories were (1) Domestic can, (2) Domestic bottle, (3) Microbrew and (4) import. The raw data is 3 4 1 1 3 4 3 3 1 3 2 1 2 1 2 3 2 3 1 1 1 1 4 3 1beer = scan() 3 4 1 1 3 4 3 3 1 3 2 1 2 1 2 3 2 3 1 1 1 1 4 3 1barplot(beer) # this isnt correctbarplot(table(beer) # Yes, call w
59、ith summarized databarplot(table(beer)/length(beer) # divide by n for proportiontable(beer)/length(beer)整理pptCEO salaries: Suppose, CEO yearly compensations are sampled and the following are found (in millions). (This is before being indicted for cooking the books.) 12 .4 5 2 50 8 3 1 4 0.25sals = s
60、can() # read in with scan12 .4 5 2 50 8 3 1 4 0.25mean(sals) ;var(sals) :sd(sals) ;median(sals)fivenum(sals) # min, lower hinge, Median, upper hinge, maxsummary(sals) data=c(10, 17, 18, 25, 28,28); summary(data); quantile(data,.25); quantile(data,c(.25,.75) 整理pptsort(sals); fivenum(sals);summary(sals)mean(sals,trim=1/10) ;mean(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医院住院楼混凝土施工承包合同
- 生态农业管理创新技巧
- 企业资金管理办法:资金结构调整
- 钢铁冶炼工程招投标实施策略
- 2024年铲车节能减排协议3篇
- 2024展厅装饰装修承包合同(含展品保管与维护)3篇
- 2024年度赵苑离婚协议中子女探望权及监护权协议书3篇
- 社会工作教师聘用协议
- 施工协议书与材料质量
- 2025版口腔医疗机构聘用口腔外科医生服务协议3篇
- 期末测试卷(一)2024-2025学年 人教版PEP英语五年级上册(含答案含听力原文无听力音频)
- 2023-2024学年广东省深圳市南山区八年级(上)期末英语试卷
- 期末 (试题) -2024-2025学年人教PEP版(2024)英语三年级上册
- 汉服娃衣创意设计与制作智慧树知到期末考试答案章节答案2024年四川文化产业职业学院
- 《大数据技术原理与应用(第3版)》期末复习题库(含答案)
- 广东省中山市2023-2024学年四年级上学期期末数学试卷
- 8款-组织架构图(可编辑)
- 海螺牌水泥质量检验报告28天报告425加章2015
- 风电项目监理大纲附录风电工程设备监理项目表
- 云南省教育科学规划课题开题报告 - 云南省教育科学研究院
- 二年级上,数学,3个两位数加减,80题,(竖式计算)
评论
0/150
提交评论