AI 时代的 R 语言AI 时代的 R 语言_第1页
AI 时代的 R 语言AI 时代的 R 语言_第2页
AI 时代的 R 语言AI 时代的 R 语言_第3页
AI 时代的 R 语言AI 时代的 R 语言_第4页
AI 时代的 R 语言AI 时代的 R 语言_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1/ChinaR10thAIAI时代的R数据数据的时代新时代的2017中国R语言会议(上海华东师范大20171202数据的数据的时代新时代的数据中的科学统计学的滥觞信息时代的数据科目2/ChinaR10th1数据的时1统计学的滥信息时代的数据科2新时代的21数据的时1统计学的滥信息时代的数据科2新时代的2数数据的时代新时代的数据中的科学统计学的滥觞信息时代的数据科2/ChinaR10th概率论的发1494年,现代会计学之父帕西奥利提出奖金分配问概率论的发假设两个人A和B在玩一种游戏,胜者得10分,负者得0分,先得60分者获胜。如果突然游戏终止,而此时A的得分是50分,B的得分是30分,奖金应该如何分配给AB1654年,帕斯卡正式创立概率32岁的帕斯卡和54岁的费马通信讨论奖金分配的问题,得到了正确的答案7:1。1812年,拉普拉斯完善了古典概率数数据的时代新时代的数据中的科学PAGE3/ChinaR10th计学的滥觞信息时代的数据科蒲丰投针LyL2D蒲丰投针LyL2D TimesofDropping:数数据的时代新时代的数据中的科学统计学的滥觞信息时代的数据科PAGE4/ChinaR10thPlayfairPlayfair的线图数数据的时代新时代的数据中的科学统计学的滥觞信息时代的数据科PAGE5/ChinaR10th赫歇赫歇尔的散点图位置 100120140 位置 100120140年伦敦伦敦霍乱防治图南丁南丁格尔的玫瑰图目1数据的时目1统计学的滥信息时代的数据科2新时代的2数数据的时代新时代的数据中的科学统计学的滥觞信息时代的数据科PAGE9/ChinaR10th统计学的起凯特勒,近代统计学之统计学的起高尔顿,早期的统计大1855年发现了父子的遗传身高向平均值回归的现象。1969律,发表了专著《遗传天才1892年发表了专著《指纹学1901年,高尔顿资助并与其学生皮尔逊等人联合创办了科学提勒,数理统计的先19世纪时就发现了很多现代统计学中的成果,但是由于论都是丹麦语,很多先驱性的工作当时没被重视,直到年后才广为人知也是精算领域的先驱,在最初的精算师国际组织中担任要职推断统计卡尔·皮尔推断统计1857年出生于英国,被誉为是“数理统计的创始人1895年提出皮尔逊分布族,1900年提出卡方检验皮尔逊以倾斜分布的方式提出了革命性的思想,对19世纪费希1890年出生于英国,被誉为是“推断统计之父1912年提出了最大似然估计。1925年出版的《研究者用的统计方法》是第一本推断统计学的教科书,对统计方法的奈1894年出生于俄国,区间估计和假设检验理论的创始人。和艾贡·皮尔逊(卡尔·皮尔逊之子)共同做了很多伟大的数数据的时代新时代的数据中的科学统计学的滥觞信息时代的数据科PAGE10/ChinaR10th目1数据的时目1统计学的滥信息时代的数据科2新时代的2数据数据的时代新时代的什么是数据科学数据中的科学统计学的滥觞信息时代的数据科PAGE10/ChinaR10th数据科学的来C.F.JeffWu于1997年非常旗帜鲜明地提出了“Statistics=DataScience?”从2008年DJatil和JeffHammerbacher把他们在LinedIn和acebook的工作职责定义为“数据科学家”的那段时期开始,数据科学开始在业界流行起来。定Wikipedia上的定义:数据科学是一门利用数据学习知识的数据数据的时代新时代的什么是数据科学数据中的科学统计学的滥觞信息时代的数据科PAGE11/ChinaR10thScience,机机器学计算科统计数据科商业智传数据分领域知a图形摘自《数据科学中的R语言数数据的时代新时代的数据中的科学统计学的滥觞信息时代的数据科PAGE12/ChinaR10th计算机的发计算机的发世界上第一台通用计算机,1946年在美国的宾夕法尼亚大学美国国防部用它来进行弹道计算,占地170平方米,重达吨,每秒钟可进行5000次运算ENIAC以电子管作为元器件(一共用了18000个电子管UNIVAC世界上第一台商用计算机,1951年研制成功并交付给美国人是第二代计算机的代表数数据的时代新时代的数据中的科学统计学的滥觞信息时代的数据科PAGE13/ChinaR10th早期的AI时人早期的AI时1940年,控制论之父维纳研究计算机如何像大脑一样工作1950年,人工智能之父的图灵提出了著名的“图灵测试1956年,达特茅斯大学的会议上正式使用了“人工智能”这神经网1943年,心理学家WarrenMcCulloch和数理逻辑学WalterPitts提出神经元的数学模型1957年,康内尔大学教授FrankRosenblatt提出的“感知1969年,MarvinMinsky和SeymourPapert出版了《感知机:1986年,Hinton和DavidRumelhart发表了BP算法“第五代计算机”时日本第五代“第五代计算机”时1978年,日本通产省委托东京大学计算机中心主任TohruMoto-Oka研究下一代计算机系统1981年,TohruMoto-Oka为首的委员会提交了报告《知识信日本人选择了逻辑程序语言Prolog,走的是规则和逻辑路线。1992年,日本政府宣布第五代计算机研制失败。数据挖掘时Data数据挖掘时上个世界90年代开始流行,世纪之交时跟随人们对知识爆商业智能时BusinessIntelligence商业智能时上个世界90年代末开始在业界出现,本世纪初非常火热,通常指用数据仓库、OLAP行数据分析以实现商业价值。数数据的时代新时代的数据中的科学统计学的滥觞信息时代的数据科PAGE17/ChinaR10th大数大数据时AIAI时数据的数据的时代新时代的R的发展历程不同分析领域的RR的使用建目19/ChinaR10th1数据的时12新时代的2R的发展历R的使用建议1数据的时12新时代的2R的发展历R的使用建议数数据的时代新时代的R的发展历程不同分析领域的RR的使用建PAGE19/ChinaR10thR的诞生S语言是R语言R的诞生S语言诞生于20世纪70年代由JohnM.Chambers领导的1998年美国计算机学会(ACM)授予了S语言的主要设计者JohnM.Chambers“软件系统奖。1993年,S语言的许可证被MathSoft公司买断,S-PLUS成2008年,TIBCO收购了已改名的Insightful公司R语言吸收了很多Scheme语言的特Scheme语言诞生于1975年的MIT,是LISP语言的一个方有一次R语言的作者Ross准备用Scheme向别人演示词法作用域的时候,由于手边没有Scheme的书,就用S来演示却失败了,这让他萌生了改进S语言的想法。R的诞生1993年,R语R的诞生1992年RossIhaka和RobertGentleman在奥克兰大学成为言;而他们名字的首字母都是R,于是R便成为这门语言的1993年,Ross和Robert将R的部分二进制文件放到了卡耐基·梅隆大学统计系的Statlib中,并在S语言的新闻列表苏黎世理工学院的MartinM极力劝说两位原作者公布源代R成为自由软件。于是19956R的源代码正式发布到了自由软件协会的FTP上。1997年,R核心团队成1997年第一批核心团队的成员数目为11位2008年R核心团队成员数目增加到了19位2011年开始,R核心团队成员数目达到20位R的特JohnM.Chambers2009年第一期《RJournal》上对R的R的特aninterfacetocomputationalproceduresofmanykinds(各类;interactive,hands-oninrealtime(具有可交互性,可以实时;functionalinitsmodelofprogramming(函数式编程模式;“;modular,builtfromstandardizedpieces(模块化,由标准化;数数据的时代新时代的R的发展历程不同分析领域的RR的使用建VB.NET、PHP、Delphi、AssemblyLanguageVB.NET、PHP、Delphi、AssemblyLanguageChinaR10thPAGE22/R在数据分析应用领域的发KDNuggets关于“数据分析/数据挖掘R在数据分析应用领域的发R2011KDNuggets调查数据分析类编程语言开始就排名第一,从2012年开始,在关于“数据挖掘和数据分析”工具的调查中,也超过了Excel和Rapidminer成为第一。2017年8月的“数据科学和机器学习平台”的调查中,Python超过R成为第一IEEE热门编程语言排行20178月发布的排行版中,R排名第6,前10名的编程语言为Python、C、Java、C++、C#、R、JavaScript、TIOBE编程语言排行201711月发布的排行版中,R语言排名第11,前10名的编程语言为Java、C、C++、Python、C#、JavaScript数数据的时代新时代的R的发展历程不同分析领域的RR的使用建PAGE23/ChinaR10th目1数据的时目12新时代的2R的发展历R的使用建议数数据的时代新时代的R的发展历程不同分析领域的RR的使用建PAGE23/ChinaR10th统计计简统计计最早版本的RFortran编写,当前版本主要是C/C++。R包可以很方便地支持C/C++和Fortran的开发。R的优R语言编程容易,代码易读性能相对较差,不过可以通过集C/C++或Fortran的库来解决矩阵式编简矩阵式编早期的R常被拿来和Matlab、进行比较R的优数据可视简数据可视早期的R受欢迎的重要原因是可以生编程灵活,是自定义统计图形的首选R的优可视化资源非常丰富,其中ggplot2包实现了“TheGrammarofGraphics”中主流的JavaScript有很好的结合,社区中存在很多像recharts这样的优秀第三统计学方简统计学方R语言崛起之初常被拿来和SAS比较。业界中RSAS可以进行很好的配合R的优蒙特卡洛方简蒙特卡洛方R的优最优化方简最优化方早期R的优化功能很弱,常被用来和R的优开源免费,资源丰富,编程灵活杂的方法,但是可以结合COIN-OR进行扩展机器学简机器学早期机器学习资源不如Python丰富,导致很多R用户投入了Python阵营。流工具的作者直接参与了R包的开发比如xgboostR的优学习门槛低,代码易读直接使用的运算性能相对较差深度学简深度学习框架很少直接提供R的支持。MXNet对R提供了完美的原生支持,在RStudio的贡献下,目前也有了Tensorflow和Keras的R包R的优在R的框架下可以完美地融合到分析流程中,Windows下的安装和使用非常文学化编简文学化编早期的R就引入了文学化编程的思想谢益辉的knitr发布后颠覆了这个领域,后续的bookdown有可能会改变科技类R的优资源非常丰富,功能非常强大Markdown框架的话可以比较容易系统架简系统架早期的R并未向后台服务器方向发展,在业界通常是和Java进行整合。Shiny问世后拥有了完美的服务器框架,此外fiery包也可以提供强大的后台服R的优Shiny框架非常简洁,可能是门槛最低的网站系统构建工具,与JavaScript可性能较差,一般不用作生产系统数数据的时代新时代的R的发展历

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论