商务数据分析与报表处理练习题_第1页
商务数据分析与报表处理练习题_第2页
商务数据分析与报表处理练习题_第3页
商务数据分析与报表处理练习题_第4页
商务数据分析与报表处理练习题_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、 填空题1 、 已 知 vec = 1,2,3,4, 则 表 达 式 rowi for row in vec for i inrange(len(vec0) 的值为 。2、已知 x = list(range(10) ,则表达式x-4: 的值为 。3、已知 path = rc:test.html ,那么表达式path:-4+htm 的值为 。4、已知x = 3, 5, 7,那么执行语句x1: = 2之后,x 的值为 。5、已知x = 3, 5, 7,那么执行语句x:3 = 2之后,x 的值为 。6、 已知 x 为非空列表, 那么执行语句 y = x: 之后, id(x0)= id(y0) 的

2、值为 。7、已知 x = 1, 2, 3, 2, 3 ,执行语句 x.remove(2) 之后, x 的值为 。8、表达式 3 1 的值为 。10、表达式 chr(ord(aF32)的值为。11、表达式chr(ord(a)-32)的值为 。12、表达式abs(3+4j) 的值为 。13、表达式callable(int) 的值为 。14、表达式list(str(1,2,3) = 1,2,3的值为 。15、表达式str(1, 2, 3) 的值为 。16、已知x = 123 和 y = 456 ,那么表达式 x + y 的值为 。17、已知x = a234b123c ,并且 re 模块已导入,则表达

3、式re.split(d+, x) 的值为 。18、已知x = 3, 5, 7 ,那么执行语句 x:3 = 2 之后, x 的值为 。19、表达式Hello world.lower().upper() 的值为 。20、表达式abcab.strip(ab) 的值为 。21、表达式 str(i) for i in range(3) 的值为 。22、表达式abc.txt.endswith(.txt, .doc, .jpg) 的值为 。23、表达式list(filter(None, 0,1,2,3,0,0) 的值为 。24、表达式list(filter(lambda x:x2, 0,1,2,3,0,0)

4、的值为 。25、表达式list(range(50, 60, 3) 的值为 。26、表达式list(filter(lambda x: x%2=0, range(10)的值为27、表达式 list(filter(lambda x: len(x)3,a,b, abcd) 的值为。28、Python使用 关键字来定义类。29、表达式 isinstance(abc, str)的值为。30、表达式 isinstance(abc, int)的值为。31、表达式 isinstance(4j, (int, float, complex)的值为。32、表达式 isinstance(4, (int, float,

5、complex)的值为。33、代码 print(1,2,3,sep=:)的执行结果为 。34、代码 for i in range(3):print(i, end=,)的执行结果为 。35、表达式 eval(_import_(math).sqrt(9)的值为。36、表达式 eval(_import_(math).sqrt(3*2+4*2)的值为。37、表达式eval(3+5) 的值为 8。38、大数据最具潜能的三大应用领域分别为商业智能、公共服务 和市场营销。39、HDFS寸元数据和实际数据采取分别存储的方法,元数据存储在Namenode,实际数据储存在 Datanode。40、列表、元组、字符

6、串是Python的 有序(有序?无序)序列。41、写出 range(2,10,2) 的值 2, 4, 6, 8。42、数据仓库的主要特征是面向主题、 集成 时变 、和 非易失。参考答案:1、1, 3, 2, 4 2、6, 7, 8, 9 3、c:test.htm 4、3, 2 5、2 6 、True7、1, 3, 2, 3 8、12 9、32 10、A 11 、A 12 、5.0 13、True 14 、 False15、1,2, 3 16、123456 17、,b , c 18、 219、HELLO WORLD 20、c 21 、0, 1, 222、True23、1,2, 3 24、3 25

7、、50, 53, 56, 59 26、0, 2, 4, 6, 827、abcd28、class 29、True 30、False 31、True32、False33、1:2:3 34、0,1,2, 35、3.036、5.037、838、商业智能公共服务市场营销39、Namenode Datanode 40、有序 41、2,4,6,842、面向主题集成 时变 非易失二、简答题1、叙述大数据的概念,并指明大数据的4V特征。答:大数据是指无法在容许的时间内用常规软件工具对其内容进行抓取、管理和处理数据。大数据4V特征为:大量化 多样化 快速化 价值密度低2、列举身边获取大数据的例子。(1) QQ微博

8、等社交软件产生的数据(2)天猫,京东等电子商务产生的数据(3)互联网上的各种数据3、简述数据预处理方法和内容。 数据清洗:包括填充空缺值,识别孤立点,去掉噪声和无关数据。 数据集成:将多个数据源中的数据结合起来存放在一个一致的数据存储中。需要注意不同数据源的数据匹配问题、数值冲突问题和冗余问题等。 数据变换:将原始数据转换成为适合数据挖掘的形式。包括对数据的汇总、 聚集、概化、规范化,还可能需要进行属性的重构。 数据归约:缩小数据的取值范围, 使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。2、简述大数据的数据管理方式。答:对于图像、视频 、URL、地理位置等类型多样的数

9、据,难以用传统的结构化方式描述, 因此需要使用由多维表组成的面向列存储的数据管理系统来组织和管理数据。也就是说,将数据按行排序,按列存储,将相同字段的数据作为一个列族来聚合存储。不同的列族对应数据的不同属性,这些属性可以根据需求动态增加,通过这样的分布式实时列式数据库对数据统一进行结构化存储和管理,避免了传统数据存储方式下的关联查询。3、画出y sin(x), y2 cos(x)在x ,上的曲线,如图:两种曲线的比较图10.5=y1=sin(x)t- y2=cos(x)4、画出ysin(x) , y2 cos(x) , y3 tan(x)在土上的曲线,画在三个子图中,如图:1y1=sin(x)

10、, x -,y5tan(x)-5-3-2-1三、编程题1、利用给定的数据,创建分裂式饼图。Labels= Nokia , Samsd , Apple , Lumia Values=10,30,45,152、利用fill.between函数填充多边形区域。数据给定为:x = np.arange(0.0, 2, 0.01)y1 = np.sin(np.pi*x)y2 = 1.7*np.sin(4*np.pi*x)B*je 那鼻口力 GdS-cokir wFere: * 2 3fli;WA一1 QQ *DH*0T5111 第 1 H 100bMiE mafieve1 Butma*;:zTWam ci as a so ara 1如 11 第 1 ra 却 do3、绘制等值线图。颜色设置先由黑色过渡到红色,再过渡到黄色,最后最大值使用白色。这种彩图中,cmp参数的值为plt.cm.hot 。数据为:x=np.arange(-2.0,2.0,dx)y=np.arange(-2.0,2.0,dy)? Q -15 -10 -fl S 00 旺 1。15x轴两侧,4、使用条状图表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论