5G通信大数据分析与应用王苏南课后参考答案_第1页
5G通信大数据分析与应用王苏南课后参考答案_第2页
5G通信大数据分析与应用王苏南课后参考答案_第3页
5G通信大数据分析与应用王苏南课后参考答案_第4页
5G通信大数据分析与应用王苏南课后参考答案_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.大数据技术各国都加大了投入,具体表现有哪些?参考答案:美国把大数据研究和生产计划提高到国家战略层面;英国在五年内投资1000万英镑建立世界上首个“开放数据研究所”;法国投入3亿欧元资金用于推动大数据领域的发展;日本公布了新IT战略——“创建最尖端IT国家宣言”;印度在数据开放方面效仿美国政府的做法,制定了一个一站式政府数据门户,把政府收集的所有非涉密数据集中起来等。2.NHBigdata大数据平台的特点有哪些?参考答案:1.多源数据的高效集成2.异构数据的海量存储3.场景丰富的计算框架4.海量数据的实时分析挖掘5.统一的平台化管理监控6.便捷易用的数据操作7.立体化的数据安全8.多样化的通信实训案例9.实时的案例结果数据可视化显示3.大数据技术在通信领域目前已存在的典型的应用有哪些?参考答案:大数据技术可对移动通信用户进行有效管理;对移动通信计费的高效管理;四合作变现;提升网络质量。4.通讯大数据课程的特点?参考答案:通信大数据这门课程将通过大数据技术融合云网的基础理论,覆盖网络的规划设计与网络部署、网络运维和运营、网络优化等多个维度锻炼和提升学生的数据分析、数据处理能力。5.通信大数据产业的关注点有哪些?参考答案:规范数据交易模式;积极树立数据应用成熟行业标杆;探索新的数据应用模式。1、Hadoop发展至现在经历了几个大版本的更新,分别是什么?参考答案:3个,hadoop1.0、hadoop2.0、hadoop3.0。2、大数据组件中,提供数据存储的组件叫什么,主要包含了哪些实例(服务),实例的作用是什么?参考答案:HadoopDistributedFileSystem,简称HDFS,是一个分布式文件系统。包含了NameNode和DataNode两个实例;NameNode存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等;DataNode在本地文件系统存储文件块数据,以及存储数据块等。3、YARN的作用是什么,主要包含什么实例(服务),什么作用?参考答案:主要负责集群资源的协调管理;ResourceManager(RM):负责整个集群资源(内存、CPU等)的管理;NodeManager(NM):负责单个节点服务器资源的管理。4、MapReduce架构用于计算的阶段是什么?参考答案:分为Map、Reduce两个截断,Map过程将输入数据拆分成多个小块分别进行处理,Reduce过程主要负责汇聚结果值。列举几项Hive的优缺点?参考答案:优点:操作接口采用类SQL语法,提供快速开发的能力(简单、容易上手);避免了去写MapReduce,减少开发人员的学习成本。Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数。缺点:实现算法比较局限,迭代式算法无法表达;Hive调优比较困难,粒度较粗。该章节介绍的计算法框架有哪些?哪个更优秀一些?参考答案:Spark和MapReduce两种;Spark的计算更加优秀。消息队列的组件是哪个?参考答案:KafkaZookeeper的主要作用?参考答案:ZooKeeper的主要作用是提供一种可靠的、分布式的协调服务,使得分布式系统中的各个节点能够协同工作,保持一致性,实现可靠的分布式应用。问答:简述sql中的插入数据操作语句。inserintotable表名[(字段列表)]values(值列表);查询字段非空的写法有哪些?Isnotnull和<>’’对表tables的字段sname进行模糊查询,查询出姓”张”的数据的写法?Select*fromtablesWheresnamelike‘张%’;对表tables的字段sname进行模糊查询,查询出姓”张”,名字是三个字的数据,的数据的写法?Select*fromtablesWheresnamelike‘张__’;列举去重查询的两种sql写法,表名tablename,对字段sname进行去重查询;第一种:selectdistinctsnamefromtablename;第二种:selectsnamefromtablenamegroupbysname;查询工资总和大于9000的部门编号以及工资和,工资信息表表名emp,部门编号字段为deptno,工资信息字段sal?selectdeptno,SUM(sal)FROMempGROUPBYdeptnoHAVINGSUM(sal)>9000;两个表关联产生笛卡尔积时,关联后的数据数据量跟两个表的关系?当产生笛卡尔积后,关联后的数据是两表数据量的乘机。写出三种内连接的sql,实现表名t1t2的内连接Select*fromt1,t2;Select*fromt1joint2;Select*fromt1innerjoint2;sql语言主要分类有哪几种?数据定义语言(DDL)、数据操作语言(DML)、数据查询语言(DQL)、数据控制语言(DCL)列举Python的几个标准的数据类型Numbers(数字)、String(字符串)、List(列表)、Tuple(元组)、Dictionary(字典)Python支持多少种数字类型?分别列举共4种。分别为:int(有符号整型)、long(长整型)、float(浮点型)、complex(复数)字典和列表是python中最灵活的两种内置数据结构类型,他们之间的区别是什么?列表是有序的对象集合,字典是无序的对象集合。字典当中的元素是通过键来存取的,而不是通过偏移存取。python中的循环语句有哪些,举例说明。while判断条件(condition):执行语句(statements)……foriterating_varinsequence:执行语句(statements)……循环中break和continue语句均可停止循环,他们之间的区别在哪里?continue语句跳出本次循环,而break跳出整个循环。Python位运算符代表和运算、或运算的符号是什么?和运算:&或运算:|python语言写一个判断,判断当变量a等于0,且当变量b等于1或变量c不等于2时,打印输出变量d。ifa==0and(b==1orc!=2):print(d)用python写一个for循环,初始i=0,循环当i=100跳出循环foriinrange(101):#循环范围从0到100,包括100ifi==100:#当i等于100时break#跳出循环print(i)#输出当前i的值定义一个列表a,并对a逐个增加原始,1,2,3,4,5,6#定义一个空列表aa=[]#逐个增加元素a.append(1)a.append(2)a.append(3)a.append(4)a.append(5)a.append(6)print(a)1、5G主要性能指标有哪些?答案:共有8个,分别是峰值速率、用户体验速率、频谱效率、移动性、时延、连接密度、网络能效、区域业务容量。2、列举几个智能网优关键KPI指标?答案:无线接通率指标、RRC连接建立成功率、切换成功率、无线掉线率。3、通信数据源有哪些?答案:DT(Drivetest)数据,MR测量报告,CDR呼叫详细记录、基站工参、性能数据、DPI数据、告警数据、投诉数据。4、nr网络质量分析有哪几大类?答案:覆盖类、干扰累、CSFB、移动性、nr速率。5、根据MR触发方式的不同,MR测量报告主要分为哪些?答案:周期性触发的MRO、事件触发的MRE、统计计算测量数据的MRS。6、搭建通信大数据平台需要登录多个服务后台修改相关配置操作吗?答案:不需要。将大数据平台安装包放到要部署的网段内的任意电脑上,双击安装根据提示操作即可。7、通信大数据平台的特色功能有哪些?答案:一键初始化、一键备份、一键删除、一键还原、一键授权、一键紧急修复、一键下电、支持用户名单导入/导出等。传统的室内分布系统的组成和分类?参考答案:室内分布系统通常由信号源和分布系统组成。无源室内分布系统、有源室内分布系统、宏蜂窝接入室内分布系统、微蜂窝室内分布系统、分布式室内分布系统、直放站室内分布系统、单通道室内分布系统、双通道室内分布系统。室分的典型场景举例?参考答案:机场的候机厅、出发厅、到达厅;火车站、汽车站的候车厅、售票处、过道、站台;地铁站点、换乘通道及隧道;体育场馆、会展中心、图书馆、博物馆等。弱覆盖的判断标准是什么?参考答案:在GSM网络RxLev_DL功率小于-90dBm,或者RSCP小于-90dBm的属于弱覆盖;在nr网络RSRP低于-110dBm属于弱覆盖;在5GNR网络RSRP低于-105dBm属于弱覆盖。覆盖类问题判断手段有哪些?参考答案:①通过路测方式。路测分为DT、CQT两种,DT主要针对道路,了解“线”的连续覆盖情况。CQT主要针对室内,了解“点”的深度覆盖情况。②KPI指标统计。主要对重定向次数及5G/4G向2G、3G高倒流比例进行统计。假如4G小区向2G小区发起重定向,一般认为是nr网络弱覆盖所致。③MR数据分析。通过对MR数据的采集、解析、可栅格化的显示全网弱覆盖的区域。④站点覆盖仿真。结合基站站高、方位角、下倾角、地理环境等,应用仿真工具,可仿真出现无线网络可能存在弱覆盖的区域。本章节分析任务的主要步骤是什么?参考答案:①创建Hive结果表(或中间表)并完善表结构提交;②创建Hive算法并编辑调试算法内容;③创建mysql数据库结果表并完善表结构提交;④创建同步算法,配置同步的库名表名参数,提交算法;⑤添加可视化模块,连接数据库,配置可视化,调试呈现结果。本章节分析任务的分析过程我们接触了哪几类数据库,作用有何不同之处?参考答案:两类;第一类为hive数据库,是集群数据库,用于计算和存放过程数据用;第二类mysql数据库,是关系型数据库,用于存放和展示业务分析结果数据用的。本章节分析任务的算法主要涉及的几个数据库的数据,介绍各库存数据的特征分别是什么?参考答案:所有任务算法涉及了5个数据库的数据,4个hive库和1个mysql数据库。4个hive库分别为:edu_odsdata、edu_middata、edu_tmpdata、edu_resdata,1个mysql库为:data_sync。edu_odsdata这个库存了源数据,我们这里的算法只做读取使用;edu_middata这个库是我们生成汇总大的数据表存放的中间库,这个库里的表是我们创建的,可以供后面多个算法取用数据;edu_tmpdata这个库为临时库,存了我们计算过程中临时存放的数据的临时表;edu_resdata这个库是结果库,最终我们计算分析的结果表都存放于此;不同于上面4个库data_sync这个库是mysql的数据库,主要存放从hive库同步过来的数据(可以是源数据、结果数据等)。分析基于大数据技术弱覆盖问题,分析问题的源数据有哪些?生成的表有哪些?参考答案:源数据是:质差路段表、采样点表、工参表(nr_poorquality_points、nr_cover_servingcell、nr_siteinfo)。生成的表是:质差路段小区采样信息汇总的中间表、弱覆盖问题质差路段表(mid_nr_servingcellinfo_XX_XXX、res_nr_pq_poorcover_XX_XXX)。分析切换问题大数据过程中使用的到源数据有哪些?参考答案:质差路段表、切换事件表(也可以是表名称nr_poorquality_points、nr_event_handover)。10、hive数据库的数据是如何同步到mysql数据库的?参考答案:通过创建同步任务,配置对应正确的库名、表名然后执行。目前主要的卫星定位系统有哪些?参考答案:美国全球定位系(GPS)、俄罗斯格洛纳斯(GLONASS)、欧洲伽利略(GALILEO)系统、中国北斗卫星导航系统。什么原因导致基站定位精度无法很高?参考答案:基站定位时,信号很容易受到干扰,所以先天就决定了它定位的不准确性。基于地理位置的服务有哪些?参考答案:地图、打车、外卖、团购、社交、物流等。热点区域的定义是什么,举例说明?参考答案:热点区域,即关注时段内人流量密集的区域,如周杰伦演唱会当晚的演唱会现场、春运期间的火车站/机场、早晚高峰的地铁口/公交站、节假日的游乐园等等;关注这样的区域可以对该类热点区域的无线网络、交通指挥、园区管理和人员安排等都有很好的指导作用,如演唱会现场可以采用安排紧急通讯车辆加大无线网络的支撑力度、演唱会附近交通进行适当管制和红绿灯策略调整等等。所以定义好热点区域就显得相当重要。我们将一天内单位区域内的活跃人流数量达到一定门限的区域定义为热点区域。在本章节分析基于位置信息的热点区域使用什么代码语言实现的,为了可视化呈现分析的结果使用了什么模块?参考答案:Python3+hql(主要处理和分析代码都是Python3、过程中获取表数据时用到了少了hivesql)。使用了folium加载地图和渲染结果数据。在本章节分析基于位置信息的热点区域的分析代码中,调用的geopy模块下的distance目的是什么?参考答案:计算不同经纬度点之间的距离。在本章节分析基于位置信息的热点区域任务中,代码顶端有什么注意事项?参考答案:加入定义代码的执行环境的参数,即添加%python,否则代码可能因为执行环境不明确导致任务无法执行。目前主要的卫星定位系统有哪些?参考答案:美国全球定位系(GPS)、俄罗斯格洛纳斯(GLONASS)、欧洲伽利略(GALILEO)系统、中国北斗卫星导航系统。什么原因导致基站定位精度无法很高?参考答案:基站定位时,信号很容易受到干扰,所以先天就决定了它定位的不准确性。基于地理位置的服务有哪些?参考答案:地图、打车、外卖、团购、社交、物流等。热点区域的定义是什么,举例说明?参考答案:热点区域,即关注时段内人流量密集的区域,如周杰伦演唱会当晚的演唱会现场、春运期间的火车站/机场、早晚高峰的地铁口/公交站、节假日的游乐园等等;关注这样的区域可以对该类热点区域的无线网络、交通指挥、园区管理和人员安排等都有很好的指导作用,如演唱会现场可以采用安排紧急通讯车辆加大无线网络的支撑力度、演唱会附近交通进行适当管制和红绿灯策略调整等等。所以定义好热点区域就显得相当重要。我们将一天内单位区域内的活跃人流数量达到一定门限的区域定义为热点区域。在本章节分析基于位置信息的热点区域使用什么代码语言实现的,为了可视化呈现分析的结果使用了什么模块?参考答案:Python3+hql(主要处理和分析代码都是Python3、过程中获取表数据时用到了少了hivesql)。使用了folium加载地图和渲染结果数据。在本章节分析基于位置信息的热点区域的分析代码中,调用的geopy模块下的distance目的是什么?参考答案:计算不同经纬度点之间的距离。在本章节分析基于位置信息的热点区域任务中,代码顶端有什么注意事项?参考答案:加入定义代码的执行环境的参数,即添加%python,否则代码可能因为执行环境不明确导致任务无法执行。移动互联网业务感知数据的获取主要有哪些方式?参考答案:方式1为测试APP方式,方式2为信令及DPI(DeepPacketInspection深度报文监测)监测方式。业务监测数据采集方式有哪些?参考答案:①业务行为信息采集功能:在不干扰用户正常使用网络和业务的前提下,在用户使用手机进行各种数据业务的过程中,对手机上发生的业务感知信息进行采集,并同时记录业务发生时的无线环境信息。②数据连接信息采集功能:在用户使用手机APP进行数据业务使用时,记录手机由无数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论