版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ETL数据预处理技术主讲人:王浩任务7-2-2使用numpy进行数据去重01.repeat函数02.03.目录tile函数unique函数CONTENTSa:array_like输入的想要进行repeat的数组repeats:intorarrayofintsrepeats参数应该是int类型或者是一个int数组。是对每一个元素repeat的次数。repeats将被广播去适应给定axis的shape。axis:int,optionalrepeat操作进行的维度,可选,int值。如果未指定,默认情况下,会将数组展平(flattened),然后返回一个扁平的重复后的数组语法numpy.repeat(a,repeats,axis=None)作用:可以用于重复数组中的元素repeat返回值repeated_array:ndarray返回的repeat后的数组,除了在指定的axis维度以外,其余各维度的shape与原数组a一致。repeat>>>np.repeat(3,4)array([3,3,3,3])#下面这个例子中,x被展平(flattened,返回的数组也是一个扁平数组)>>>x=np.array([[1,2],[3,4]])>>>np.repeat(x,2)array([1,1,2,2,3,3,4,4])语法
numpy.tile(A,reps)作用通过按照reps给定的次数,repeat数组A,构造一个新的数组>>>a=np.array([0,1,2])#a.ndim==len(reps)>>>np.tile(a,2)array([0,1,2,0,1,2])#a.ndim<len(reps),a被升维为(1,3),返回结果为(2,6)>>>np.tile(a,(2,2))array([[0,1,2,0,1,2],[0,1,2,0,1,2]])>>>b=np.array([[1,2],[3,4]])#b.ndim>len(reps),reps被作为(1,2)处理,返回结果为(2,4)>>>np.tile(b,2)array([[1,2,1,2],[3,4,3,4]])
语法numpy.unique(arr,return_index,return_inverse,return_counts)参数:arr:输入数组,如果不是一维数组则会展开return_index:如果为true,返回新列表元素在旧列表中的位置(下标),并以列表形式存储。return_inverse:如果为true,返回旧列表元素在新列表中的位置(下标),并以列表形式存储。return_counts:如果为true,返回去重数组中的元素在原数组中的出现次数。importnumpyasnpA=[1,2,2,5,3,4,3]a=np.unique(A)print(a)print("______")a,indices=np.unique(A,return_index=True)#返回新列表元素在旧列表中的位置(下标)print(a) #列表print(indices) #下标a,indices=np.unique(A,return_inverse=True)#旧列表的元素在新列表的位置print(a)print(indices)print(a[indices])#使用下标重构原数组a,indices=np.unique(A,return_counts=True)#每个元素在旧列表里各自出现了几次print(a)print(indices)输出结果:[12345][12345][01453][12345][0114232][1225343][12345][12211]小结可以用于重复数组中的元素repeat通过按照
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年衢州市柯城区事业单位人员招聘笔试参考试题及答案详解
- 2026年武汉市汉南区事业单位人员招聘考试模拟试题及答案详解
- 养老护理中的文化价值传递
- 2026年潍坊寒亭区融媒体中心公开招聘播音主持人员考试参考题库及答案详解
- 广西壮族自治区河池市2026年数学八年级第一学期期末质量检测试题含解析
- 2026年泰州市高港区事业单位人员招聘考试备考试题及答案详解
- 江苏省苏州市62027届数学八年级第一学期期末考试试题含解析
- 江苏省南通市海安市曲塘中学2026年数学八上期末监测试题含解析
- 如何书写课堂教学模式指导性文件
- 物流中心冷链仓改造预算确认函(4篇范文)
- 2025浙江省德清县交通水利投资集团有限公司招聘11人笔试参考题库附带答案详解
- 土建职称考试题库及答案
- 四川省乐山市2024-2025学年高二下学期期末教学质量检测物理试卷(含答案)
- 巴氏染色原理及步骤
- 狂犬疫苗接种程序
- 闽教版英语三年级单词表
- 加油站建设项目安全管理措施与风险控制
- 2024-2025学年人教版八年级下册期末数学质量检测试卷(含答案)
- 住院患者常见心理问题护理
- 瑞文高级推理实验APM附有答案
- 2023年井工煤矿通防作业人员理论考试题库(含答案)
评论
0/150
提交评论