版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ETL数据预处理技术主讲人:王浩任务7-2-2使用numpy进行数据去重01.repeat函数02.03.目录tile函数unique函数CONTENTSa:array_like输入的想要进行repeat的数组repeats:intorarrayofintsrepeats参数应该是int类型或者是一个int数组。是对每一个元素repeat的次数。repeats将被广播去适应给定axis的shape。axis:int,optionalrepeat操作进行的维度,可选,int值。如果未指定,默认情况下,会将数组展平(flattened),然后返回一个扁平的重复后的数组语法numpy.repeat(a,repeats,axis=None)作用:可以用于重复数组中的元素repeat返回值repeated_array:ndarray返回的repeat后的数组,除了在指定的axis维度以外,其余各维度的shape与原数组a一致。repeat>>>np.repeat(3,4)array([3,3,3,3])#下面这个例子中,x被展平(flattened,返回的数组也是一个扁平数组)>>>x=np.array([[1,2],[3,4]])>>>np.repeat(x,2)array([1,1,2,2,3,3,4,4])语法
numpy.tile(A,reps)作用通过按照reps给定的次数,repeat数组A,构造一个新的数组>>>a=np.array([0,1,2])#a.ndim==len(reps)>>>np.tile(a,2)array([0,1,2,0,1,2])#a.ndim<len(reps),a被升维为(1,3),返回结果为(2,6)>>>np.tile(a,(2,2))array([[0,1,2,0,1,2],[0,1,2,0,1,2]])>>>b=np.array([[1,2],[3,4]])#b.ndim>len(reps),reps被作为(1,2)处理,返回结果为(2,4)>>>np.tile(b,2)array([[1,2,1,2],[3,4,3,4]])
语法numpy.unique(arr,return_index,return_inverse,return_counts)参数:arr:输入数组,如果不是一维数组则会展开return_index:如果为true,返回新列表元素在旧列表中的位置(下标),并以列表形式存储。return_inverse:如果为true,返回旧列表元素在新列表中的位置(下标),并以列表形式存储。return_counts:如果为true,返回去重数组中的元素在原数组中的出现次数。importnumpyasnpA=[1,2,2,5,3,4,3]a=np.unique(A)print(a)print("______")a,indices=np.unique(A,return_index=True)#返回新列表元素在旧列表中的位置(下标)print(a) #列表print(indices) #下标a,indices=np.unique(A,return_inverse=True)#旧列表的元素在新列表的位置print(a)print(indices)print(a[indices])#使用下标重构原数组a,indices=np.unique(A,return_counts=True)#每个元素在旧列表里各自出现了几次print(a)print(indices)输出结果:[12345][12345][01453][12345][0114232][1225343][12345][12211]小结可以用于重复数组中的元素repeat通过按照
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 烈士陵园维修合同协议书
- 《利润和利润分配》课件
- 二零二四年服务合同:保管合同3篇
- 2024年度艺术文化中心干挂石材分包合同3篇
- 钢管架子租赁合同(2024)6篇
- 2024年度股权转让及增资合同标的和具体条款3篇
- 二零二四年度供应链管理合作协议合同范本2篇
- 2024年度艺术品买卖合同with合同标的:古董艺术品2篇
- 2024年度智能家居产品研发合作合同3篇
- 2024年度环保工程合同标的的施工要求与验收标准
- 铁路建设工程质量安全专项整治活动总结(完整版)
- UbuntuLinu操作系统上机实践实验题题库期末考试试卷24
- 《畜牧兽医》考试复习题库(160题)
- 邻菲罗啉安全技术说明书MSDS
- 部编版五年级道德与法治上册第三单元《我们的国土我们的家园-我们神圣的国土》第一课时
- GB/T 7284-2016框架木箱
- 脑与认知科学国家重点实验室开放课题申请书
- 国家自然科学基金申请经验汇总课件
- 电视画面编辑(本科)王晓红课件
- 神秘的虚拟货币-比特币课件
- 输血查对制度10月(1)课件
评论
0/150
提交评论