




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验二Pandas统计分析基础任务1读取mtcar数据并实现以下操作(1)查看mtcar数据集的元素的个数、维度、大小等信息,输出表的列名。import pandas as pdmtcars=pd.read_csv(D:桌 面 实验二 datamtcars.csv)print(mtcars 的元素个数为:n,mtcars.size)print(mtcars 的元素维度为:n,mtcars.ndim)print(mtcars 的元素大小为:n,mtcars.shape)print(mtcars 的表的列名为:n,mtcars.columns)In 1 : runfile(JCr /Us e rs
2、/Ad/nin/. spyde r -py3/ temp -pyJ j wdir= C:/Users/Admin/. spyder-py3r) mtcars的元素个数为:3S4mtcars的元素维度为:2mtcars的元素大小为:(32, 12)mtcars的表的列名为:Index( Unnamed : & mpg cyl1 disp t hp drat t Rwt t qsec p vs 1 F am geart carbdtype=,object)(2)使用describe方法对整个mtcar数据集进行描述性统计。import pandas as pd mtcars=pd.read_csv
3、(D:桌 面 实验二 datamtcars.csv)print(对整个mtcar数据集进行描述性统计为:n,mtcars.describe()In 2: runfile( JC:/Users/Adrnin/. spyder-py3/temp-pyJj wdir= 对整个mtca数据集进行描述性统计为:mpgcyldisp amcount32.mean2&.0906256.1875&23&.721S75.0.46253.std6.9269481.785922123.938694.0.4989910.min10.40904,明豹的71.100&9.。,丽丽丽3.25%L5.425&94.0000S
4、&120.B25&9.0.&0000&3.5&%19.200&S06.0000&S196.300&0.0.&0000&4.75%22.800S&08.0000S&B26.000&9.1.&0000&4.max33.9&0&S08.0&00&S472 .阳如阳.1. &5.JC:/Users/Admin/.spyder-py3J)gearcarb.6875002.&125.7378041,6152.&0000&2.&S00.&0000&8.&S008 rows x 11 columns(3)计算不同cyl (气缸数)、carb(化油器)对应的mpg (油耗)和hp (马力)的均值。import
5、pandas as pdmtcars=pd.read_csv(D:桌 面 实验二 datamtcars.csv)x=mtcars.loc:,cyl,carb,mpg,hpy=x.groupby(cyl,carb).mean()print(不同cyl (气缸数)、carb(化油器)对应的mpg (油耗)和hp (马力)的均值为:n,y)(4)输出mpg和hp前5个元素。import pandas as pdmtcars=pd.read_csv(D:桌 面 实验二 datamtcars.csv)x=mtcarsmpg,hp:5print(mpg 和 hp 前 5 个元素为:n,x)In 4: ru
6、nfile( JCr/Users/Adffin/. spyder-py3/tmp.py,丁 wdir=JC:/Users/Admin/ spyder-py3J) mpgflhp前5个无素为::mpg hp0 21.0 11021.0 11022.89321.4 11018/7 175(5)输出mtcar数据的前3行元素。import pandas as pdmtcars=pd.read_csv(D:桌 面 实验二 datamtcars.csv)x=mtcars:1:3print(mtcar数据的前3行元素为:n,x)In 5: runfilef1C:/Users/Admin/. spyder-
7、py3/temp. py t wdir = C:/Users/Admin/.spyder-py31) mtcar教据的前3行元素为:Unnamed: & mpg cyl disp hp drat i/t qsec vs am gear carbMazda RX4Nag:21. &6160,611.3.9&2.87517.02&144Datsun716-22.84108.&933.852.32&IS.611141(6)使用head()和tail()方法输出前后5行数据。import pandas as pdmtcars=pd.read_csv(D:桌 面 实验二 datamtcars.csv)p
8、rint(mtcar 数据的前 5 行元素为:n,mtcars.head()print(mtcar 数据的后 5 行元素为:n,mtcars.tail()In 6: run file ( JC; /Us ers/Admin/. spyder -py3/ temp ratEP数据的前5行元表为:Unnamed: 0 mpg cyl disp hp 0Mazda RX421.&6160.0110Mazda RX4 Uag21,06160.0110Datsun 71022.S4108.093Hornet 4 Drive21,46258.11.Hornet Sportabout 18,7S 360.0
9、 175 .pyJ j wd ir=r C; /Us ers/Admin/. spyder -py3J) qsec vs am gear carb16.4614417.02014418.61114119.44103117.O200325 rows x 12 columns rntcar数据的后5行元素为:Unnamed: & mpgLotus Europa B&.4Ford Pantera L 15.8FerrariDino19.73&MaseratiBora15.031Vo1ao142E21 4守48684L disp hp ,95.1 113 351,0 264 145.0 175 301
10、.0 335 121-0 109 qsec vs16,910018-61a in11111gear55554carb246825rows x 12 columns(7)用loc和iloc分别提取第1列和第3列的数据。import pandas as pdmtcars=pd.read_csv(D:桌 面 实验二 datamtcars.csv) print(mtcar 数据的第 1 列和第 3 列的数据为:n,mtcars.loc:,mpg,disp)print(mtcar 数据的第 1 列和第 3 列的数据为:n,mtcars.iloc:,1,3)In 7: runfile( 己spyd巴己ff
11、ip.dir=C:/Users/Admin/, spy-der-py3J)Mb教据的第1列和第3列的数据为:mpg disp021.0160.0121.0160.0222-8108.0321.4258.0418/7360.0518,1225.0614.3360.0724.4146/7S22,8140,8919.2167.61017.8167.61116.4275,81217.3275,81315.2275,81410.4472.01510.4460.01614/7440.01732.478/71830.475 ?71933,971,12021.5120,12115.5318.02215.230
12、4.02313.3350.0踏19.240.025-27.379.02626,0LZ0.3279 5.115-S351西15.7145. G30-15.03&1.03121 .4121.6Me数据的第列和第M列的数据为:dip021.016 0.6121.016 0.0222.816-8.6321 .425S.04-IE-7360.05IB-1Z258514.3360.0724.4146.7822,8140 . B919.2167. 6L017.0167.61116.4275-81Z17.3275-81315.2275-8L41*0.4472.01516.4LG14,744.&L732.47S
13、. 7IS3G.475-7L933.971.12921.5120.12115.5318-02215.2304-02313.3350-02419.22527.379.02626.0120. 3273&.495-12S15 ,S351.02919,7145. &15 ,&m眦.83121.4121. &取出列名为mpg、hp,行名为2, 3, 4的数据。import pandas as pdmtcars=pd.read_csv(D:桌 面 实验二 datamtcars.csv)print(列名为 mpg、hp,行名为 2, 3, 4 的数据为:n,mtcars.loc2:4,mpg,hp)In 8
14、 s ru n f ile ( J C: /Us er s/ZIdmin/. spyder-py3/ temp - pyJ wd ir=J C; /Us er s/Admin/. spyder -py3r) 列名为叩目、hp,行名为W,3, 4的数据为:mpg hp22.89321.4 11018.7 175取出列位置为2和4,行位置为5, 6, 7的数据。import pandas as pdmtcars=pd.read_csv(D:桌 面 实验二 datamtcars.csv) print(列位置为2和4,行位置为5, 6, 7的数据为:n,mtcars.iloc5:8,2,4)#前闭后开
15、区间In 9 s runfilef JC:/Users/Admin/. spyder-py3/temp-pyr j wd ir=1C:/Users/Admin/. spydr-py3J) 列位-置-为w和4,行位置为5,E,7的数据为: cyl hp TOC o 1-5 h z 61058245462取出列位置为3,行名为2-6的数据。import pandas as pdmtcars=pd.read_csv(D:桌 面 实验二 datamtcars.csv)print(列位置为 3,行名为 2-6 的数据为:n,mtcars.loc2:6,disp)(11)新增1列,名称为abc(abc=m
16、pg+hp),输出前5行数据。import pandas as pd mtcars=pd.read_csv(D:桌 面 实验二 datamtcars.csv) mtcarsabc=mtcarsmpg+mtcarshpprint(输出前 5 行数据为:n,mtcars.head()In 11: runfile ( JCr/Users/Admin/. spyd&r-py3/temp- pyJj 输出前5-行数据为:Unnamed: & mpg cyl disp hp- . . . vs&Mazda RX421. &616&. 911. . .0Mazda RX4 Uag21.0616&. 011.
17、 . .0Datsun 71022.84108.993.1Hornet 4 Drive21.46258.011.0. . .1Hornet Sportabout IS.78 36&.9 175.0wdir=JCr/Us ers/Admin/.spyd&r-py3x)am gear carbabc144 131.0144 131.0141 115.8031 131.4032 193/75rows k 13 columns(12)删除前两行数据。import pandas as pdmtcars=pd.read_csv(D:桌 面 实验二 datamtcars.csv) print (删除前两行数
18、据前的长度为:n,len(mtcars) mtcars.drop(labels=range(0,2),axis=0,inplace=True) print (删除前两行数据后的长度为:n,len(mtcars) print(前五行数据为:n,mtcars.head()In 12: runfile(rC:/Users/.spyder-py3/temp-pyfj wdir=JC:/Users/Admin/.spyder-pySJ) 删除前两行数据前的长度为:32删除前两行数据后的长度为=3前五行数据为:Unnamed: mpg cyl disp hp qsec vs am gear carbDat
19、sun 710 22.84 108.093 18,611141Hornet 4 Drive 21.46 258.0 1119.441031Hornet Sport a bout18/78360.0175 17020032Valiant18,16225.010520.221031Duster 360 14.38 360.0 245 15.8400345 rows x 12 columns(13)删除abc列。import pandas as pdmtcars=pd.read_csv(D:桌 面 实验二 datamtcars.csv)mtcarsabc=mtcarsmpg+mtcarshpprin
20、t(删除 abc 前列索引为:n,mtcars.columns)mtcars.drop(labels=abc,axis=1,inplace=True)print(删除 abc 后列索引为:n,mtcars.columns)In 13 : runfile( JC:/Users/Adniin/. spyder-py3/temp- pyJj wdir =JCr/Users/Admin/. spyder-py3 删踪ahc前列索引为:Index( Unnamed: & t mpgt cyl11 Fdisp t hp drat11 wt qsec t 1 vs am geart carb abct dt
21、ype=object)删除北匚后列索引为二Index( Unnaimed : j mpg j cyl j disp j hpdrat j wtv j qsec B j vs F j am pgearj carbj dtype=Fobject1)任务2导入鸢尾花数据,实现以下操作特别注意:导入后的DataFrame仅含5列:Sepal.Length,Sepal.Width,Petal.Length,Petal.Width,Species读入数据,输出前五行import pandas as pdiris=pd.read_csv(D:W 实验二 datairis.csv)print(前五行的数据为:
22、n,iris.head()In 14 s runfilef JC:/Users/Admin/. spyder-py3/temp- pyJ j wdir=JC;/Users/Admin/. spyder-py3r)前五行的数据为:Unnamed! 9Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies015.13.5L40.2setosa124.93,01.40.2setosa234/73.21-3.2setosa344.63,1L50.2setosa455.03.61.40.2setosa统计每个品种的数量import pandas as
23、pdiris=pd.read_csv(D:W 实验二 datairis.csv) print(每个品种的数量为:n,irisSpecies.value_counts()In 15 s runfilef JCr/Users/Admin/. spyder-py3/temp. pyJ j wdir= JC:/Users/4dmin/. spyc/&r-py3J) 每个品制的数里为: versicolor 5 virginica50setosa50Nlame: SpecieSj dtype: int64按品种划分,每个品种的花萼,花瓣的长度和宽度的最大值分别是多少?import pandas as p
24、d iris=pd.read_csv(D: 桌面 实验二 datairis.csv) print(每个品种的数量为:n,iris.groupby(Species).max()In 16 s runfile ( rCr/Users/Admin/. spyder-py3/temp. pjzJj wdir=JC:/Users/Admin/. pyder-py3J)每个品种的数里为:Unnamed: 0SpeciesSepal.LengthSepal.WidthPetal. LengthPetal.Widthsetosa505.84.4L99.6versicolor1007.03.45.11,8vir
25、ginica1507.93.86.92.5计算每个品种所有属性(花瓣、花萼的长度和宽度)数值的跨度范围,即最大值减去最小值import pandas as pdiris=pd.read_csv(D:W 实验二 datairis.csv)def range_iris(arr):return arr.max()-arr.min()print(每个品种所有属性数值的跨度范围为:n,iris.groupby(Species).agg(range_iris)In 17: runfile ( I:/UEJLm/AdtTti/.务pyd巴尸一pyM/t巴用ppywdir=/Users/Admin/. spy
26、der-py3r)每个品种所有属性数值的跨度范围为:Unnamed : & Sepal. Length Sepal .Width Petal. L-ength Petal.Width Speciessetosa491.52.1矶90.5versicolor492.11,42.10,8virginica493.01.62.41,1计算每个品种所有属性(花瓣、花萼的长度和宽度)数值的平均值、最大值import pandas as pdiris=pd.read_csv(D:W 实验二 datairis.csv)print(每个品种所有属性数值的平均值、最大值为:n,iris.groupby(Spec
27、ies).mean(),iris.groupby(Species).max()In 18: runfile( xC:/Users/Admin/, spyder-py3/teppyTj wdir=JC;/Users/Admin/. spyder-py3每个品种所有属性数值的平均值、最大值为:Sepal.WidthPetal.LengthPetal.WidthUnnamed: Sepal,LengthSpeciessetosa25.55.0063 .4281.4629.246versicolor75.55,9362.7704.2601.326virginica125.56.5882.9745.55
28、22.926Unnamed: &Sepal, LengthSepal.WidthPetal.LengthPetal.WidthSpeciessetosa55.84.41.90.6versicolor133.45. 11.8virginica1507.93.86. 92.5任务3从excel文件foods.xlsx读取数据,并将ID列作为索引。(1)输出该 DataFrame。import pandas as pdfoods=pd.read_excel(D:桌面 实验二 datafoods.xlsx) print(输出为:n,foods)In 19: runfilef JC:/Users/Adj
29、nin/. spyder-py3/temp PPJ j wdir=JC:/Users/Admin/. spyder-py3J) 输出为ID 产地伯格数里水果类别01美国55苹果水:果2中国55梨水果3中国盟9草莓水果4中国33番茄蔬菜5新西兰3 W黄瓜蔬菜6新西兰1319羊肉肉类E7美国208牛肉肉类(2)生成如下样式的透视表,统计不同产地和类别食品价格及数量的平均值。价格数量类别 水果肉娄蔬菜水果肉玺蔬菜产地中国7.5NaN3.07.0NaNS.O新西兰NaM13 03.0NaN10.02.0美国5.020.0NaN5.08.0NaNimport pandas as pdfoods=pd.r
30、ead_excel(D:桌面 实验二 datafoods.xlsx)print(透视表为:n,foods.pivot_table(价格,数量,index=产地,columns=类别)In 20 : runfilef JC;/Usrs/Admin/. spyder-py3/temp- pyJ j wdir=JCr/Users/Admin/. spyder-py3J)透祈表为:价格数里类别 水果 肉类蔬菜水果 肉类蔬菜中国 7.5 NaN 3.0 7.0 PlaPI 3.0新西兰13.0 3.0 Ha PI 10. 9 2.9美国 5.0 2&.& Ha PI8.0- Ha PI生成如下样式的透视表,统计不同产地和类别食品价
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 如何训练孩子的动手能力
- 能源行业智能电网监控与运维系统开发方案
- 物业管理行业智能物业管理与服务平台方案
- 如何提升孩子领导能力
- 游戏开发行业游戏引擎技术与应用方案设计
- 2025年特种铜合金材料项目发展计划
- 2025年金属包装容器及其附件合作协议书
- 2025年区熔硅单晶合作协议书
- 2025年系列脱氯剂项目发展计划
- 2025年心脏除颤器项目发展计划
- 3D打印实训指导书
- 除草机器人简介
- 当代文学第一章1949-1966年的文学思潮
- 抽油井检泵作业课件
- 2022年06月2022年广东肇庆广宁县司法局招考聘用政府雇员名师点拨卷V答案详解版(3套版)
- a320飞机空调系统工作原理与使用维护分析
- 施工机具进场检查验收记录
- 《液压与气动技术项目教程》高职配套教学课件
- 民俗学概论 第一章 概述课件
- 2022年七步洗手法操作考核评分标准
- 过敏性紫癜的护理PPT课件(PPT 33页)
评论
0/150
提交评论