中小学pandas1公开课教案教学设计课件案例测试练习卷题_第1页
中小学pandas1公开课教案教学设计课件案例测试练习卷题_第2页
中小学pandas1公开课教案教学设计课件案例测试练习卷题_第3页
中小学pandas1公开课教案教学设计课件案例测试练习卷题_第4页
中小学pandas1公开课教案教学设计课件案例测试练习卷题_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

pandas1:入门+SeriesPandas,即pythondataanalysis的组合缩写,是python语言中基于numpy和matplotlib搭建的第三方数据分析库,与后两者共同构成了python数据分析的基础工具,享有数据分析三剑客之名。pandas导入pandas模块的方法如下:importpandasaspd#pd是用户为导入模块取的别名pandas中的数据结构pandas提供了Series和DataFrame两种数据结构。SeriesSeries是一种一维的数据结构,包含一个数组的数据和一个与数据关联的索引(index),索引值默认是从0起递增的整数。列表、字典等可以用来创建Series数据结构,与列表不同的是,Series的索引可以指定,类型可以为字符串型。创建Series功能:创建1个Series结构类型的对象,存储3名同学的身高值。序号代码运行结果说明例1importpandasaspds1=pd.Series([166,178,180])print(s1)016611782180dtype:int64通过列表创建索引默认例2importpandasaspds2=pd.Series([166,178,180],index=["s01","s02","s03"])print(s2)s01166s02178s03180dtype:int64通过列表创建索引指定例3importpandasaspds3=pd.Series({'a':1,'b':2,'c':10,'d':20})print(s3)a1b2c10d20dtype:int64通过字典创建查看Series对象的属性值功能:查看Series对象的index、values属性值。序号代码运行结果说明例4importpandasaspds4=pd.Series([166,178,180])foriins4.index:print(i)012查看index例5importpandasaspds5=pd.Series([166,178,180])foriins5.values:print(i)166178180查看values例6importpandasaspds6=pd.Series([166,178,180])foriins6:print(i)166178180与例5结果相同选取并修改Series对象中的值功能:通过索引可以选取Series对象中的值,通过赋值语句可以修改Series对象中的值。序号代码运行结果说明例7importpandasaspds7=pd.Series([166,178,180])s7[0]=168print(s7)016811782180dtype:int64修改索引为0的数据为168例8importpandasaspds8=pd.Series([166,178,180],index=["s01","s02","s03"])s8["s01"]=168print(s8)s01168s02178s03180dtype:int64修改索引为“s01”的数据为168例9importpandasaspds9=pd.Series({'a':1,'b':2,'c':10,'d':20})s9['c']=123print(s9)a1b2c123d20dtype:int64修改索引为‘c’的数据为123课中例析题:1.在python中为了对数据进行分析整理,可以使用的库是()A.requests库 B.pandas库 C.matplotlib库 D.jieba库2.Pandas中Series左列默认index是从()开始生成。A.0 B.1 C.NaN D.a3.代码创建Series对象,第二行数据的下标是()importpandasaspds1=pd.Series([188,167,156],index=["I.","II.","III."])A.167 B.2. C.I. D.II.4.下列有关Series说法错误的是()A.Series中index和values长度必须一致B.Series中必须指定indexC.两个index不同的Series可以相加D.Series经过计算后的index顺序和计算前不一定一致5.Pandas中有两个重要的数据结构:___________、____________pandas2:DataFrameDataFrameDataFrame是一种二维的数据结构,由1个索引列(index)和若干个数据列组成,每个数据列可以是不同的类型。【DataFrame是由一组数据与一对索引(行索引和列索引)组成的表格型数据结构。其存储形式与Excel的数据存储形式很相近。】DataFrame可以看作是共享同一个index的Series的集合。创建DataFrame对象的方法很多,通常用一个相等长度的列表或字典来创建。创建DataFrame使用函数.DataFrame()创建DataFrame对象功能:使用函数.DataFrame()创建DataFrame对象序号代码运行结果说明例1importpandasaspddata=["a","b","c","d"]df1=pd.DataFrame(data)print(df1)00a1b2c3d通过列表创建,创建一列数据例2importpandasaspddata=[["a","A"],["b","B"],["c","C"],["d","D"]]df2=pd.DataFrame(data)print(df2)010aA1bB2cC3dD通过列表创建,创建两列数据例3importpandasaspddata={"小写":["a","b","c","d"],"大写":["A","B","C","D"]}df3=pd.DataFrame(data)print(df3)小写大写0aA1bB2cC3dD通过字典创建,创建两列数据例4importpandasaspddata={"小写":["a","b","c","d"],"大写":["A","B","C","D"]}df4=pd.DataFrame(data,index=["甲","乙","丙","丁"])print(df4)小写大写甲aA乙bB丙cC丁dD通过字典创建,字典中的key值相当于列索引,如要加入行索引,可使用index=[]参数例5importpandasaspddata={"小写":["a","b","c","d"],"大写":["A","B","C","D"]}df5=pd.DataFrame(data,columns=["大写","小写"])print(df5)大写小写0Aa1Bb2Cc3Ddcolumns可以设定数据列的顺序直接读取数据文件创建DataFrame对象功能:直接读取二维数据文件创建DataFrame对象①read_excel()可以从.xlsx文件导入生成DataFrame②read_csv()可以从.csv文件导入生成DataFrame序号代码运行结果说明例6importpandasaspddf6=pd.read_excel("test.xlsx")print(df6)namesexage0Helenfemale151Brucemale192Jackmale17导入.xlsx文件创建DataFrame对象。(以下是test.xlsx中数据)例7importpandasaspddf7=pd.read_csv("test.csv")print(df7)namesexage0Helenfemale151Brucemale192Jackmale17导入.csv文件创建DataFrame对象。(以下是test.csv中数据)name,sex,ageHelen,female,15Bruce,male,19Jack,male,17查看DataFrame对象的属性值功能:查看Series对象的行索引index、列标题columns、值values,并行列转置。序号代码运行结果说明例8importpandasaspddf8=pd.read_excel("test.xlsx")foriindf8.index:print(i)012行索引index(以下是test.xlsx中数据)例9importpandasaspddf9=pd.read_excel("test.xlsx")foriindf9.columns:print(i)namesexage①列标题columns②df9.columns可简写为df9例10importpandasaspddf10=pd.read_excel("test.xlsx")foriindf10.values:print(i)['Helen''female'15]['Bruce''male'19]['Jack''male'17]值values例11importpandasaspddf11=pd.read_excel("test.xlsx")print(df11.T)012nameHelenBruceJacksexfemalemalemaleage151917行列转置选取并修改DataFrame对象中的值选取DataFrame对象中的值功能:DataFrame对象中的一列可以通过字典记法或属性来检索,可以通过布尔型数据选取满足条件的行,使用at[]方法可以根据行标签和列标签选取单个值。选取方法1:法字典记法选取方法2:属性选取方法3:布尔型数据选取方法4:at[]方法序号代码运行结果说明例12importpandasaspddf12=pd.read_excel("test.xlsx")print()0Helen1Bruce2JackName:name,dtype:object字典记法。(以下是test.xlsx中数据)例13importpandasaspddf13=pd.read_excel("test.xlsx")print(df13["sex"])0female1male2maleName:sex,dtype:object属性。例14importpandasaspddf14=pd.read_excel("test.xlsx")print(df14[df14["sex"]=="male"])namesexage1Brucemale192Jackmale17布尔型数据。选取sex为male的数据。例15importpandasaspddf15=pd.read_excel("test.xlsx")print(df15.at[2,"name"])Jackat[]方法。选取第3行”name”列数据。通过赋值修改DataFrame对象中的值功能:DataFrame对象中的列可以通过赋值来修改序号代码运行结果说明例16importpandasaspddf16=pd.read_excel("test.xlsx")df16.age=[16,20,18]print(df16)namesexage0Helenfemale161Brucemale202Jackmale18(以下是test.xlsx中数据)将DataFrame结果导出功能:DataFrame对象导出为.xlsx文件可使用函数to_excel()函数DataFrame对象导出为.csv文件可使用函数to_csv()函数序号代码运行结果说明例17importpandasaspddata=[["a","A"],["b","B"],["c","C"],["d","D"]]df17=pd.DataFrame(data)df17.to_excel("df2excel.xlsx")df17.to_csv("df2csv.csv")生成两个文件:DataFrame结果导出在文件中课中例析题:1.在pandas库中用于查看列类型的函数是A.pandas.DataFrame.shapeB.pandas.DataFrame.dtypesC.pandas.DataFrame.columnsD.pandas.DataFrame.columns.dtypes2.使用to_excel()函数,读取Excel文件创建DataFrame对象,也可以使用read_excel()函数,创建Excel文件保存数据。_____________(填:对或错)3.请使用at[]方法,获取一个df对象中第6行,“姓名”列数据:_____________4.以下程序用data建立一个DataFrame,先后取出member和class数据,并转置显示。______________________________________(1)__data={'grade':['Grade1','Grade1','Grade1','Grade2','Grade2'],'class':['Class1','Class2','Class3','Class1','Class2'],'member':[43,45,44,46,47]}_____________________________________(2)___print(df.T)课后巩固题:1.下列哪个不是Series对象的属性()A.indexB.valuesC.nameD.T2.下列关于DataFrame的说法,错误的是()A.可以读取Excel文件创建DataFrame对象B.创建DataFrame对象后,可以修改索引C.可以将Series转换为DataFrameD.Series和DataFrame之间不能进行运算3.有如下Python程序段:importpandasaspds1=pd.Series([120,130,180],index=["s01","s02","s03"])s1[1]=125print(s1[s1<179])执行代码后,输出的结果是()A.120125180B.s01120s02125C.s01125s02130D.1201254.有如下Python程序段:importpandasaspddata=[[1,2,3],[3,4,5],[6,7,8]]df1=pd.DataFrame(data,index=["a","b","c"],columns=["e","f","g"])print(df1)输出的结果是()A.efg123345678B.efga123b345c678C.a123b345c678D.abce123f345g6785.Series和DataFrame是pandas模块中的数据结构,下列描述错误的是()A.DataFrame

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论