![《Python数据分析与应用从数据获取到可视化》课后答案_第1页](http://file4.renrendoc.com/view/197e2a582cc50b4a7dcfc7177090958a/197e2a582cc50b4a7dcfc7177090958a1.gif)
![《Python数据分析与应用从数据获取到可视化》课后答案_第2页](http://file4.renrendoc.com/view/197e2a582cc50b4a7dcfc7177090958a/197e2a582cc50b4a7dcfc7177090958a2.gif)
![《Python数据分析与应用从数据获取到可视化》课后答案_第3页](http://file4.renrendoc.com/view/197e2a582cc50b4a7dcfc7177090958a/197e2a582cc50b4a7dcfc7177090958a3.gif)
![《Python数据分析与应用从数据获取到可视化》课后答案_第4页](http://file4.renrendoc.com/view/197e2a582cc50b4a7dcfc7177090958a/197e2a582cc50b4a7dcfc7177090958a4.gif)
![《Python数据分析与应用从数据获取到可视化》课后答案_第5页](http://file4.renrendoc.com/view/197e2a582cc50b4a7dcfc7177090958a/197e2a582cc50b4a7dcfc7177090958a5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1章填空题数据分析Anaconda实时判断题错对错选择题BCDC简答题数据分析是指,用适当的\t"/item/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/_blank"统计分析方法对收集来的大量数据进行分析,从中提取有用信息和形成结论,并加以详细研究和概括总结的过程。明确目的和思路、数据收集、数据处理、数据分析、数据展现。(1)语法简单精炼,适合初学者入门;(2)拥有一个巨大且活跃的科学计算社区;(3)拥有强大的通用编程能力;(4)人工智能时代的通用语言;(5)方便对接其它语言。第2章填空题ndarray二维位长广播数组或列表判断题错对对对错选择题BDACA简答题答案:NumPy数组不需要循环遍历,即可对每个元素执行批量的算术运算操作,这个过程叫做矢量化运算。答案:两个数组的某一维度等长,或其中一个数组为一维数组。程序题答案:importnumpyasnparr=np.zeros(5)print(arr)答案:importnumpyasnparr=np.zeros((8,8),dtype=int)arr[1::2,::2]=1arr[::2,1::2]=1print(arr)第3章填空题NumpySeriesDataFrame索引数据列表字典按置排序按索引排序判断题对对错错错选择题ABAAB简答题Series是一个类似于一维数组的对象,它能够保存任何类型的数据,主要由一组数据和与之相关的索引两部分构成。DataFrame是一个类似于二维数组的对象,它每列的数据可以是不同的数据类型。DataFrame的结构也是由索引和数据组成的,并且DataFrame的索引有行索引和列索引。层次化索引是在单层索引的基础上进行延伸,它可以在一个轴上存在多层索引,并且能够以低纬度形式表示高维度的数据。程序题答案: importnumpyasnp importpandasaspd df_data=np.array([[1,5,8,8],[2,2,4,9], [7,4,2,3],[3,0,5,2]])#创建数组 col_data=np.array(['A','B','C','D'])#创建数组 #基于数组创建DataFrame对象 df_obj=pd.DataFrame(columns=col_data,data=df_data) df_obj答案: sort_values_data=df_obj.sort_values(by=['B'],ascending=False) sort_values_data答案: sort_values_data.to_csv(r'E:\数据分析\write_data.csv') '写入完毕'第4章填空题完整性唯一性权威性合法性一致性人为原因机械原因列索引行索引横向堆叠纵向堆叠内连接外连接正态分布判断题对错对错错选择题BACDA简答题在数据预处理的过程中会根据数据的实际情况选择合适处理方法,常用的预处理操作有数据清洗、数据合并、数据重塑、数据转换等,在这几种操作中又分别含有不同的数据处理方法,例如在数据清洗过程中含有空值和缺失的检测、重复值的处理、异常值的处理等。在Pandas中常用的数据合并操作有:concat()函数表示沿着一条轴将多个对象进行堆叠、merge()函数表示根据一个或多个键将不同的对象进行合并、join()方法表示根据索引或指定的列来合并数据、combine_first()方法表示填充合并数据。程序题答案: importpandasaspdimportnumpyasnpgroup_a=pd.DataFrame({'A':[2,3,5,2,3],'B':['5',np.nan,'2','3','6'],'C':[8,7,50,8,2],'key':[3,4,5,2,5]})group_b=pd.DataFrame({'A':[3,3,3],'B':[4,4,4],'C':[5,5,5]})print(group_a)print(group_b)答案: group_a=group_bine_first(group_b) group_a答案: group_a.rename(columns={'key':'D'})第5章填空题拆分应用合并列表或数组DataFrame对象某列的名称字典或Series对象函数广播DataFrameGroupBy判断题对错错对对选择题AABCD简答题分组聚合的流程一般为拆分、应用、合并。拆分是将数据集按照一定规则分成若干组;应用是对这些分组的数据进行一系列操作的过程;合并是将这些执行操作后的结果进行整合。常用的分组方式主要有4种,分别为:列表或数组,列表或数组的长度需要与带分组轴的长度一致、DataFrame中某列的名称、字典或Series对象、函数。程序题答案: importpandasaspdstudnets_data=pd.DataFrame({'年级':['大一','大二','大三','大四','大二','大三','大一','大三','大四'],'姓名':['李宏卓','李思真','张振海','赵鸿飞','白蓉','马腾飞','张晓凡','金紫萱','金烨'],'年龄':[18,19,20,21,19,20,18,20,21],'身高':[175,165,178,175,160,180,167,170,185],'体重':[65,60,70,76,55,70,52,53,73]})data=studnets_data.groupby('年级')Freshman=dict([xforxindata])['大一']print(Freshman)答案:data=data.apply(max)deldata['年级']print(data)答案:Junior=dict([xforxindata])['大三']print(Freshman['体重'].apply('mean'))print(Junior['体重'].apply('mean'))第6章填空题浏览器直方图饼图折线图pyplot数据的类型分布情况bar判断题对对错错对选择题ADDBD程序题答案: importpandasaspdstock_data=pd.DataFrame({'证券代码':['000609','000993','002615','000795','002766','000971','000633','300173','300279','000831'],'证券简称':['中迪投资','闽东电力','哈尔斯','英洛华','索菱股份','高升控股','合金投资','智慧松德','和晶科技','五矿稀土'],'最新价':[4.80,4.80,5.02,3.93,6.78,3.72,4.60,4.60,5.81,9.87],'涨幅跌%':[10.09,10.09,10.09,10.08,10.06,10.06,10.06,10.05,10.05,10.04]})print(stock_data)答案:importmatplotlib.pyplotasplt%matplotlibinlineplt.rcParams['font.sans-serif']=['SimHei']#正常显示中文标签plt.rcParams['axes.unicode_minus']=False#正常显示负号x_axis=stock_data['证券简称']y_axis=stock_data['最新价']plt.bar(x_axis,y_axis)#先进行保存,如果在show()函数后面使用,会出现保存的图片是空白图片plt.savefig(r"C:\Users\admin\Desktop\shares_bar.png")plt.show()第7章填空题时间序列预测基础频率重采样Period判断题对对错对错选择题ADDBC简答题答案:时间戳(Timestamp),表示特定的时刻,比如现在。固定周期(period),比如2018年或者2018年10月。时间间隔(interval),由起始时间戳和结束时间戳表示。答案如果是将高频率数据聚合到低频率,则称为降采样;如果是将低频率数据转换到高频率数据,则称为升采样。程序分析题答案:运行产生ValueError异常,主要是因为date_range()函数中必须传入start、end、periods、freq中至少三个参数,而代码中只传入了start和freq参数。答案:运行结果为5答案:运行出现异常,因为日期字符串的格式不能够被正确解析第8章填空题基于情感词典基于机器学习余弦相似度无关相关有监督数据集准备特征抽取模型训练分类结果评价判断题错对错对错选择题ADDAB简答题答案:文本分析是指对文本的表示及其特征项的选取,通过一定的方法将文本中无用的信息删除,留下有用的信息,通过对这些有用的信息进行挖掘,最后根据结果分析文本得意图和目的。答案:常用的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度公共设施装修工期延误赔偿及质量保证协议
- 2025年度电子商务交易安全保障合同
- 2025高考作文预测:正确“出圈”才能出彩
- 个人职业能力提升计划
- 未来年的市场拓展计划
- 提升职业道德与素养的工作计划
- 班级网络学习平台的搭建与维护计划
- 2025年休闲专用车及其零附件项目建议书
- 小学生艺术欣赏能力培养计划
- 2025年2-氯-5-甲基吡啶项目合作计划书
- 4地球-我们的家园《我们共同的责任》说课稿 -2023-2024学年道德与法治六年级下册统编版
- 护理交接班改进
- 2024年湖北省武汉市中考语文试卷
- 二零二五年度高品质小区沥青路面翻新施工与道路绿化合同2篇
- 2022年北京市初三一模语文试题汇编:基础知识综合
- 2025年广东食品药品职业学院高职单招高职单招英语2016-2024年参考题库含答案解析
- 诗经楚辞文学常识单选题100道及答案
- 2 爆破工试题及答案
- AI辅助的慢性病监测与管理系统
- 电路基础知到智慧树章节测试课后答案2024年秋江西职业技术大学
- 2025年小学蛇年寒假特色作业
评论
0/150
提交评论