商务数据分析与报表处理练习题_第1页
商务数据分析与报表处理练习题_第2页
商务数据分析与报表处理练习题_第3页
商务数据分析与报表处理练习题_第4页
商务数据分析与报表处理练习题_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、 填空题1、已知vec = 1,2, 3,4,则表达式 rowi for row in vec for i in range(len(vec0) 的值为_。2、已知 x = list(range(10),则表达式 x-4: 的值为_。3、已知 path = r'c:test.html',那么表达式 path:-4+'htm' 的值为_。4、已知 x = 3, 5, 7,那么执行语句 x1: = 2之后,x的值为_。5、已知 x = 3, 5, 7,那么执行语句 x:3 = 2之后,x的值为_。6、已知x为非空列表,那么执行语句y = x:之后,id(x0)

2、= id(y0)的值为_。7、已知 x = 1, 2, 3, 2, 3,执行语句x.remove(2) 之后,x的值为_。8、表达式 3<<2 的值为_。9、表达式 65 >> 1 的值为_。10、表达式chr(ord('a')32) 的值为_。11、表达式chr(ord('a')-32) 的值为_。12、表达式 abs(3+4j) 的值为_。13、表达式 callable(int) 的值为_。14、表达式 list(str(1,2,3) = 1,2,3 的值为_。15、表达式str(1, 2, 3) 的值为_。16、已知 x = 

3、9;123' 和 y = '456',那么表达式 x + y 的值为_。17、已知 x = 'a234b123c',并且re模块已导入,则表达式re.split('d+', x) 的值为_。18、已知 x = 3, 5, 7,那么执行语句 x:3 = 2之后,x的值为_。19、表达式 'Hello world'.lower().upper() 的值为_。20、表达式 'abcab'.strip('ab') 的值为_。21、表达式 str(i) for i in range(3) 的值为_。2

4、2、表达式 'abc.txt'.endswith('.txt', '.doc', '.jpg') 的值为_。23、表达式 list(filter(None, 0,1,2,3,0,0) 的值为_。24、表达式 list(filter(lambda x:x>2, 0,1,2,3,0,0) 的值为_。25、表达式 list(range(50, 60, 3) 的值为_。26、表达式 list(filter(lambda x: x%2=0, range(10) 的值为_。27、表达式 list(filter(lambda x: len

5、(x)>3, 'a', 'b', 'abcd') 的值为_。28、Python使用_关键字来定义类。29、表达式 isinstance('abc', str) 的值为_。30、表达式 isinstance('abc', int) 的值为_。31、表达式 isinstance(4j, (int, float, complex) 的值为_。32、表达式 isinstance('4', (int, float, complex) 的值为_。33、代码 print(1,2,3,sep=':&#

6、39;) 的执行结果为_。34、代码 for i in range(3):print(i, end=',') 的执行结果为_。35、表达式 eval('''_import_('math').sqrt(9)''') 的值为_。36、表达式 eval('''_import_('math').sqrt(3*2+4*2)''') 的值为_。37、表达式 eval('3+5') 的值为_8_。38、大数据最具潜能的三大应用领域分别为 商业智能 、

7、 公共服务 和 市场营销 。39、HDFS对元数据和实际数据采取分别存储的方法,元数据存储在 Namenode ,实际数据储存在 Datanode 。40、列表、元组、字符串是Python的_有序_(有序?无序)序列。41、写出range(2,10,2)的值 2,4,6,8 。42、数据仓库的主要特征是 面向主题 、 集成 时变 、 和 非易失 。参考答案:1、1, 3, 2, 4 2、6, 7, 8, 9 3、'c:test.htm' 4、3, 2 5、2 6、True7、1, 3, 2, 3 8、12 9、32 10、'A' 11、'A' 1

8、2、5.0 13、True 14、False15、'1, 2, 3' 16、'123456' 17、a,b,c18、 2 19、'HELLO WORLD' 20、'c' 21、'0', '1', '2' 22、True23、1, 2, 3 24、325、50, 53, 56, 59 26、0, 2, 4, 6, 827、'abcd'28、class29、True30、False31、True32、False33、1:2:334、0,1,2,35、3.036、5.037

9、、838、商业智能 公共服务 市场营销39、Namenode Datanode 40、有序 41、2,4,6,842、面向主题 集成 时变 非易失二、简答题1、叙述大数据的概念,并指明大数据的4V特征。答:大数据是指无法在容许的时间内用常规软件工具对其内容进行抓取、管理和处理数据。大数据4V特征为:大量化 多样化 快速化 价值密度低 2、列举身边获取大数据的例子。(1)QQ,微博等社交软件产生的数据 (2)天猫,京东等电子商务产生的数据 (3)互联网上的各种数据 3、简述数据预处理方法和内容。数据清洗:包括填充空缺值,识别孤立点,去掉噪声和无关数据。数据集成:将多个数据源中的数据结合起来存放在

10、一个一致的数据存储中。需要注意不同数据源的数据匹配问题、数值冲突问题和冗余问题等。数据变换:将原始数据转换成为适合数据挖掘的形式。包括对数据的汇总、聚集、概化、规范化,还可能需要进行属性的重构。数据归约:缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。2、简述大数据的数据管理方式。答:对于图像、视频 、URL、地理位置等类型多样的数据,难以用传统的结构化方式描述,因此需要使用由多维表组成的面向列存储的数据管理系统来组织和管理数据。也就是说,将数据按行排序,按列存储,将相同字段的数据作为一个列族来聚合存储。不同的列族对应数据的不同属性,这些属性可以根据需

11、求动态增加,通过这样的分布式实时列式数据库对数据统一进行结构化存储和管理,避免了传统数据存储方式下的关联查询。3、 画出,在上的曲线,如图: 4、画出,在上的曲线,画在三个子图中,如图:三、编程题1、利用给定的数据,创建分裂式饼图。Labels=Nokia,Samsu,Apple,LumiaValues=10,30,45,152、利用fill.between函数填充多边形区域。数据给定为: x = np.arange(0.0, 2, 0.01)y1 = np.sin(np.pi*x)y2 = 1.7*np.sin(4*np.pi*x)3、绘制等值线图。颜色设置先由黑色过渡到红色,再过渡到黄色,最后最大值使用白色。这种彩图中,cmp参数的值为p

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论