大量数据的表示和处理课件_第1页
大量数据的表示和处理课件_第2页
大量数据的表示和处理课件_第3页
大量数据的表示和处理课件_第4页
大量数据的表示和处理课件_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大量数据的表示和处理数据复杂性简单数据单个数据无内部结构(不可分,原子)复杂数据由多个相关数据组成可用集合体类型表示单个,但有内部结构可用面向对象的类刻画222333数据集合体大量同类型数据组成一个整体一次物理实验得到的大批数据一个文档中的大量单词一个画布上的所有图形一个学校里的所有学生, .Python提供集合体数据类型: list, tuple, dict, set, file444数据结构构成一个整体的大量数据成员一般是相关的,即其间存在某种逻辑关系不但要表示各数据成员,还要表示其间逻辑关系逻辑关系可以体现在存储结构中例如:字符串HELLO连续存储的序列结构即可表示5个字符间的关系分散独

2、立存储5个字符,则无法表示其间关系存储结构必须有利于对数据的操作666序列的操作通用的序列操作s1 + s2s * n或n * ssi或si:j或si:j:klen(s)min(s)max(s)x in s或x not in s777字符串回顾:字符串是字符序列.基本操作:索引,子串,合并,重复.string库不能修改字符串作为对象方法999列表回顾:Python列表是由多个数据项组成的序列,可通过索引引用列表中的数据.Python列表的特点:列表的成员可以是任何数据类型;列表的成员可以修改ai = xai:j = bdel aidel ai:j列表对象Python将列表实现为对象,并提供了很

3、多方法.10例:列表对象的方法 a = Irrational,3.14,2.718,pi and e a.sort() a3.14, 2.718, Irrational, pi and e a0.reverse() a2.718, 3.14, Irrational, pi and e a.insert(2,number) a2.718, 3.14, Irrational, number, pi and e print a.pop(0)2.718, 3.14 aIrrational, number, pi and e 11编程案例:统计程序(1)统计指标累积型:如总和.可以累积计算sum = 0

4、data = raw_input(输入新数据:)while data != : x = eval(data) sum = sum + x 整体型:如中位数.不能累积计算,只能在获得全体数据后计算.中位数, 一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数)12编程案例:统计程序(2)# statistics.pydef getInputs():def sum(aList):def mean(aList):def median(aList):def main(): data = getInputs() sigma = sum(data) xbar =

5、 mean(data) med = median(data) print .main()13元组回顾:元组也是序列,适用所有序列操作.元组的特点:不能修改若序列创建后就不再改变,则可表示为元组:效率高,防止误操作.Python也将元组实现为对象.方法:.index(x).count(x)tuple()可将字符串和列表转换成元组.14集合:无序集合体Python提供set类型元素无序元素不重复set值的创建:用.用set(.):可将字符串,列表,元组转换成集合空集:set(),而非 16例:集合值的创建 1,2,3set(1, 2, 3) s = 1,1,2,2,2,3,3 sset(1, 2,

6、 3) set(set)set(s, e, t) set(1,1,1,2,1)set(1, 2) set(1,2,1,1,2,3,4)set(1, 2, 3, 4) set()set()17例:集合运算 s1 = 1,2,3,4,5 s2 = 2,4,6,8 6 in s1False s1 | s2set(1, 2, 3, 4, 5, 6, 8) s1 & s2set(2, 4) s1 - s2set(1, 3, 5) s1 |= s2 s1set(1, 2, 3, 4, 5, 6, 8) len(s2)4 19集合对象Python以面向对象方式实现set20字典:无序集合体在集合体中查找数据

7、:序列采用索引查找:根据位置检索.字典采用关联查找:根据给定数据检索与之关联的数据.字典类型dict:“键-值对”的无序集合.给定键,查找与之关联的值存储:按内部最有效的方式,不保持创建顺序.键类型常用字符串,整数;值类型则任意.21字典的操作字典创建d = k1:v1, k2:v2, . , kn:vn或dict()检索:从ki检索vidki值可修改dki = 22例:字典创建 d = Lucy:1234,Tom:5678,Mary:1357 print dMary: 1357, Lucy: 1234, Tom: 5678 d1 = dict(name=Lucy,age=8,hobby=(b

8、k,gm) d1hobby: (bk, gm), age: 8, name: Lucy d2 = dict(5,1),Worker,(6,1),Child,(7,1),CPC) d2(5, 1): Worker, (6, 1): Child, (7, 1): CPC 23例:字典检索 d1nameLucy d1age8 d1hobby(bk, gm) d1genderTraceback (most recent call last): File , line 1, in d1genderKeyError: gender d2(6,1)Child d27,1CPC 24字典对象的方法Python将字典实现为对象,支持的方法:键存在性:.has_key()键列表:.keys()值列表:.values()键值对列表:.items()清空字典:.clear()26例:字典对象的方法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论