




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ETL数据预处理技术主讲人:王浩任务7-2-2使用numpy进行数据去重01.repeat函数02.03.目录tile函数unique函数CONTENTSa:array_like输入的想要进行repeat的数组repeats:intorarrayofintsrepeats参数应该是int类型或者是一个int数组。是对每一个元素repeat的次数。repeats将被广播去适应给定axis的shape。axis:int,optionalrepeat操作进行的维度,可选,int值。如果未指定,默认情况下,会将数组展平(flattened),然后返回一个扁平的重复后的数组语法numpy.repeat(a,repeats,axis=None)作用:可以用于重复数组中的元素repeat返回值repeated_array:ndarray返回的repeat后的数组,除了在指定的axis维度以外,其余各维度的shape与原数组a一致。repeat>>>np.repeat(3,4)array([3,3,3,3])#下面这个例子中,x被展平(flattened,返回的数组也是一个扁平数组)>>>x=np.array([[1,2],[3,4]])>>>np.repeat(x,2)array([1,1,2,2,3,3,4,4])语法
numpy.tile(A,reps)作用通过按照reps给定的次数,repeat数组A,构造一个新的数组>>>a=np.array([0,1,2])#a.ndim==len(reps)>>>np.tile(a,2)array([0,1,2,0,1,2])#a.ndim<len(reps),a被升维为(1,3),返回结果为(2,6)>>>np.tile(a,(2,2))array([[0,1,2,0,1,2],[0,1,2,0,1,2]])>>>b=np.array([[1,2],[3,4]])#b.ndim>len(reps),reps被作为(1,2)处理,返回结果为(2,4)>>>np.tile(b,2)array([[1,2,1,2],[3,4,3,4]])
语法numpy.unique(arr,return_index,return_inverse,return_counts)参数:arr:输入数组,如果不是一维数组则会展开return_index:如果为true,返回新列表元素在旧列表中的位置(下标),并以列表形式存储。return_inverse:如果为true,返回旧列表元素在新列表中的位置(下标),并以列表形式存储。return_counts:如果为true,返回去重数组中的元素在原数组中的出现次数。importnumpyasnpA=[1,2,2,5,3,4,3]a=np.unique(A)print(a)print("______")a,indices=np.unique(A,return_index=True)#返回新列表元素在旧列表中的位置(下标)print(a) #列表print(indices) #下标a,indices=np.unique(A,return_inverse=True)#旧列表的元素在新列表的位置print(a)print(indices)print(a[indices])#使用下标重构原数组a,indices=np.unique(A,return_counts=True)#每个元素在旧列表里各自出现了几次print(a)print(indices)输出结果:[12345][12345][01453][12345][0114232][1225343][12345][12211]小结可以用于重复数组中的元素repeat通过按照
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 外科护士长个人述职报告范文
- 2025年幼儿园疫病信息报告计划
- 抖音短视频新媒体运营职责
- 零成本智能硬件营销方案范文
- 以市场机制为翼铸博物馆核心产品之魂
- 以实验探究为翼展初中生物创新之翔:创新能力培养实践与探索
- 医疗行业一体机培训心得体会
- 压疮护理流程优化小组职责
- 专升本学科交叉学习心得体会
- 六年级下学期语文家校互动计划
- 2025年上半年驻村工作总结范例(三篇)
- 楼宇自控系统入门基础知识
- 化工企业安全操作规程培训计划
- 气管插管堵塞的原因分析课件
- 2025年南昌市产业投资集团招聘笔试参考题库含答案解析
- 热气球晚会活动方案
- 2024气爆震源操作流程及HSE风险评估标准
- 银行培训课件:客户投诉处理
- 【MOOC】结构力学-武汉理工大学 中国大学慕课MOOC答案
- GB/T 28511.1-2024平面光波导集成光路器件第1部分:基于平面光波导(PLC)的光功率分路器
- 操作手册模板【范本模板】
评论
0/150
提交评论