版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ETL数据预处理技术主讲人:王浩任务7-2-2使用numpy进行数据去重01.repeat函数02.03.目录tile函数unique函数CONTENTSa:array_like输入的想要进行repeat的数组repeats:intorarrayofintsrepeats参数应该是int类型或者是一个int数组。是对每一个元素repeat的次数。repeats将被广播去适应给定axis的shape。axis:int,optionalrepeat操作进行的维度,可选,int值。如果未指定,默认情况下,会将数组展平(flattened),然后返回一个扁平的重复后的数组语法numpy.repeat(a,repeats,axis=None)作用:可以用于重复数组中的元素repeat返回值repeated_array:ndarray返回的repeat后的数组,除了在指定的axis维度以外,其余各维度的shape与原数组a一致。repeat>>>np.repeat(3,4)array([3,3,3,3])#下面这个例子中,x被展平(flattened,返回的数组也是一个扁平数组)>>>x=np.array([[1,2],[3,4]])>>>np.repeat(x,2)array([1,1,2,2,3,3,4,4])语法
numpy.tile(A,reps)作用通过按照reps给定的次数,repeat数组A,构造一个新的数组>>>a=np.array([0,1,2])#a.ndim==len(reps)>>>np.tile(a,2)array([0,1,2,0,1,2])#a.ndim<len(reps),a被升维为(1,3),返回结果为(2,6)>>>np.tile(a,(2,2))array([[0,1,2,0,1,2],[0,1,2,0,1,2]])>>>b=np.array([[1,2],[3,4]])#b.ndim>len(reps),reps被作为(1,2)处理,返回结果为(2,4)>>>np.tile(b,2)array([[1,2,1,2],[3,4,3,4]])
语法numpy.unique(arr,return_index,return_inverse,return_counts)参数:arr:输入数组,如果不是一维数组则会展开return_index:如果为true,返回新列表元素在旧列表中的位置(下标),并以列表形式存储。return_inverse:如果为true,返回旧列表元素在新列表中的位置(下标),并以列表形式存储。return_counts:如果为true,返回去重数组中的元素在原数组中的出现次数。importnumpyasnpA=[1,2,2,5,3,4,3]a=np.unique(A)print(a)print("______")a,indices=np.unique(A,return_index=True)#返回新列表元素在旧列表中的位置(下标)print(a) #列表print(indices) #下标a,indices=np.unique(A,return_inverse=True)#旧列表的元素在新列表的位置print(a)print(indices)print(a[indices])#使用下标重构原数组a,indices=np.unique(A,return_counts=True)#每个元素在旧列表里各自出现了几次print(a)print(indices)输出结果:[12345][12345][01453][12345][0114232][1225343][12345][12211]小结可以用于重复数组中的元素repeat通过按照
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026上半年贵州事业单位联考贵州省红十字会招聘1人笔试备考题库及答案解析
- 2026年显微结构观察技术及应用
- 2025年下一年教资笔试及答案
- 2025年大专线上笔试题目及答案
- 2026天津市东丽区国有企业基层工作人员联合招聘18人笔试模拟试题及答案解析
- 2025年东城区中西医笔试及答案
- 2025年南宁区图书馆事业编考试及答案
- 2025年北京市文化馆笔试及答案
- 2025年财会高端人才笔试及答案
- 2025年山西省运城事业单位考试及答案
- 长护险人员管理培训制度
- 2026河南大学附属中学招聘77人备考题库附答案
- 网络安全运维与管理规范(标准版)
- 2026年包头职业技术学院高职单招职业适应性考试模拟试题含答案解析
- 2026年XX医院儿科护理工作计划
- 2025-2026学年贵州省安顺市多校高一(上)期末物理试卷(含答案)
- 呼吸机相关肺炎预防策略指南2026
- 妊娠期缺铁性贫血中西医结合诊疗指南-公示稿
- 北京市2025年七年级上学期期末考试数学试卷三套及答案
- 2026年上海理工大学单招职业适应性测试题库附答案
- TCEC电力行业数据分类分级规范-2024
评论
0/150
提交评论