




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目一财务大数据认知目标了解大数据概念了解大数据特点了解大数据发展历程了解大数据应用场景了解财会大数据的概念及特点了解大数据分析过程及分析工具任务一大数据认知任务实施大数据的含义大数据的发展历程大数据的特点我国大数据发展战略大数据应用场景大数据思维大数据的含义大数据无法用常规数据工具在一定时间内进行采集、处理、存储和计算的数据集合大数据获取技术大数据存储和管理技术大数据分析和挖掘技术大数据可视化展现技术等处理模式需要专门的处理模式才能使其具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产大数据的定义大数据的含义大数据产生的原因全球互联网约有40亿人都是数据源全球大约有1000亿个传感器都是数据源人类活动的进一步扩展都是数据源大数据的含义身边的大数据精准广告推荐专车精准匹配模型精准车险费用……大数据的发展历程萌芽阶段(1980年-2008年)成长阶段(2009年-2012年)爆发阶段(2013年-2015年)快速发展阶段(2016年至今)萌芽阶段
(1980年-2008年)198020072008未来学家托夫勒《第三次浪潮》著作首次提到大数据“第三次浪潮的华彩乐章”社交网络激增大数据概念注入新生机《自然》杂志推出“大数据”封面专栏肯尼斯库克尔在《经济学人》上发表了长达14页的大数据专题报告——《数据,无所不在的数据》成长阶段
(2009年-2012年)20102月麦肯锡在《大数据:下一个创新、竞争和生产率的前沿》研究报告中指出:“大数据时代已经到来”20116月工业和信息化部关于印发《物联网“十二五”发展规划》海量数据存储、数据挖掘、图像视频智能分析等都是大数据的重要组成部分12月《“十二五”国家战略性新兴产业发展规划》“加强以网络化操作系统、海量数据处理软件等为代表的基础软件、云计算软件、工业软件、智能终端软件、信息安全软件等关键软件的开发”20127月维克托·迈尔-舍恩伯格《大数据时代》国内风靡,推动国内大数据发展12月爆发阶段
(2013年-2015年)我国大数据元年大数据成为国家战略《促进大数据发展行动纲要》发布英国政府直接投资1000万英镑建立“开放数据研究所”澳大利亚政府发布《公共服务大数据战略》美国发布政府网站数字化分析仪表盘快速发展阶段(2016年至今)2016《贵州省大数据发展应用促进条例》增加“数据科学与大数据技术专业”2018达沃斯论坛把大数据作为重要议题2019发布13个与大数据行业相关的新职业六个国家数字经济创新发展试验区正式启动2020世界人工智能大会云端峰会数据智能主题论坛成功举办快速发展阶段(2016年至今)2021《“十四五”大数据产业发展规划》发布,明确了我国“十四五”期间大数据产业发展的行动纲领2022《大数据白皮书(2022年)》对全球和我国大数据发展总体态势进行了分析总结,指出我国大数据产业发展态势好、动力足2023中国首个数据服务枢纽上线,提供了企业、数商、生态伙伴、公共部门等多个数据提供方的集成服务。同年,数据资产入表政策的实施,进一步推动了数据资源向数据资产转化2027(E)据数据分析公司Statista预测,全球大数据市场预计到2027年将增长到1030亿美元大数据的特点大数据的特点——Volume海量数据全球每秒发送290万封电子邮件,一分钟读一篇的话,足够一个人昼夜不停的读5.5年采集数据Twitter上每天发布5000万条消息,假设10秒浏览一条消息,足够一个人昼夜不停地浏览16年存储数据1PB是多大?计算数据假设一首音乐的大小约为10M,1PB的存储空间就可以存储约1亿首这样的音乐。若听一首音乐需要4分钟,那么听完1PB存储空间里的音乐约需要7,158,278小时,也就是说即使7
24小时不间断地听,也需要约298,261天才能听完,即需要约817年才能听完。大数据的特点——Variety多样化数据类型数字文本图像音频视频地理位置信息网络日志结构化数据关系型数据库中的数据特点:有统一的数据结构和规范的数据访问和处理方法非结构化数据办公文档邮件各类报表图像音频视频信息特点:不能采用预先定义好的数据模型或没有以一个预先定义的方式来组织半结构化数据XML文件HTML文件特点:介于结构化数据和非结构化数据之间的数据大数据的特点——Velocity大数据的时效性数据生成速度高数据处理速度高大数据的特点——Value大数据的价值密度大数据价值密度相对较低数据分析结果的商业价值很高我国大数据发展战略2012数据已经成为一种新的经济资产类别,就像货币和黄金一样2014廖仁斌建议:应尽快在国家层面启动大数据发展战略2015第一次将大数据写入党的全会决议,正式纳入我国国家发展战略2017十九大提出,要推动互联网、大数据、人工智能和实体经济深度融合2018中国国际大数据产业博览会26日在贵阳开幕2019《决定》多次提及互联网、大数据、人工智能等新一代信息技术我国大数据发展战略2020提出加快培育数据要素市场2021强调加快数字化发展建设数字中国2022布局数据基础制度体系2023明确数字中国建设的指导思想、主要目标、重点任务和保障措施明确数据要素发展目标和行动计划2024全会明确提出“建设和运营国家数据基础设施,促进数据共享”“加快构建促进数字经济发展体制机制,完善促进数字产业化和产业数字化政策体系”大数据应用
场景大数据+民生大数据+交通大数据+金融大数据+安全数据自身安全大数据+民生贵阳的“大数据民生”工程大数据民生万企融合五级通办一个不落隔空诊脉精准扶贫大数据+交通智慧交通现场人工执法越来越少交通通行效率越来越高交通决策越来越科学用户服务内容越来越精准交通服务自动化程度越来越高大数据+金融智慧银行客户画像精准营销风险管控运营优化大数据+安全大数据助力公共安全大数据助力移动互联网安全数据自身安全大数据安全案例2015年5月,美国国税局宣布其系统遭受攻击2016年9月22日,全球互联网巨头雅虎证实,在2014年间至少有5亿用户的账户信息被黑客窃取2017年3月,公安部破获一起盗卖公民信息的特大案件2018年6月,圆通10亿条快递数据,被以1比特币的价格打包出售2019年7月,微软的Window10操作系统过度搜集用户数据被警告2020年初,公安部破获了一起特大窃取贩卖公民个人信息案2021年,Facebook遭遇了一次大规模数据泄露数据自身安全大数据安全防护数据资产梳理对公司拥有的数据、数据所处位置及数据敏感级别保持恰当的控制数据库加密主动对核心数据加密存储数据库安全运维防止运维人员对数据库进行访问和操作时的恶意操作和高危操作数据脱敏通过脱敏规则对数据匿名化,实现敏感隐私数据的可靠保护数据库漏扫通过授权扫描、非授权扫描、弱口令、渗透攻击等检测方式发现数据库安全隐患大数据思维全样思维大数据时代的思维方式应该从样本思维转向全样思维,从而能够更加全面、立体、系统地认识总体状况容错思维当拥有海量即时数据时,绝对的精准不再是追求的主要目标,适当忽略微观层面上的精确度,容许一定程度的错误与混杂,可以在宏观层面拥有更好的知识和洞察力相关思维大数据时代,人们可以通过大数据技术挖掘出事物之间隐蔽的相关关系,获得更多的认知与洞见,运用这些认知与洞见就可以帮助人们捕捉现在和预测未来任务二财务大数据认知任务实施财务大数据的概念大数据对财会行业的影响大数据在财会行业的应用财务大数据的特点财务大数据财务大数据非结构化的业务数据、政治法律环境数据、经济环境数据、社会和文化数据及技术类数据等大幅度增多财务大数据数据处理需求要求数据分析人员的反应时间要短,反应速度要快企业数字资产辅助企业进行战略决策海量结构化和非结构化的数据财务大数据时代的特征大数据对财会行业的影响提高传统财会工作效率、重复性工作将被系统取代促进传统财会流程重组,财务共享中心是未来趋势预算管理更精准,财务会计走向决策高度大数据在财会行业的应用数据智能将成为未来企业财务的核心利用大数据和人工智能提升企业预测和决策水平从经济业务中提取到更加多维的数据,从而突破原有的简单辅助核算将财务数据工作管得更细、更全、更好,让隐藏的数据价值体现出来实现财务会计向管理会计的转型,充分体现会计职业的价值财务大数据的特点更细致的数据更多维的数据更多元的数据任务三大数据分析处理工具认知任务实施大数据处理流程大数据处理工具大数据处理流程数据获取数据预处理数据分析数据可视化数据清洗数据标准化企业内部数据企业外部数据狭义数据分析数据挖掘数据跟踪、钻取、多维度分析多数据源、实时数据更新、交互式数据展示数据质量大数据处理工具ExcelPythonPython与Excel比较项目二Python环境搭建与使用目标了解Python开发环境掌握Anaconda环境的安装掌握JupyterNotebook的基本使用方法任务一Python开发环境的搭建任务实施Python与Anaconda下载Anaconda安装Anaconda检验Anaconda安装是否成功任务二认识JupyterNotebook工具任务实施设置程序保存位置启动JupyterNotebook详解JupyterNotebook界面任务三使用JupyterNotebook创建Python程序任务实施编写第一个Python程序编写销售毛利率计算程序操作JupyterNotebook文件计算北京MG公司2023年度的销售毛利率项目第一季度第二季度第三季度第四季度营业收入274.5525.33888.41595.85营业成本158.67301.35568.23311.09毛利润115.83223.98320.18284.76北京MG公司2023年度营业收入和营业成本项目三Python基础程序设计目标掌握变量、数据类型和运算符的含义与用法理解列表结构,并掌握列表的用法理解字典结构,并掌握字典的用法任务一使用变量计算企业净资产收益率相关知识变量常用数据类型运算符与优先级输出格式变量什么是变量?地址数据011202203A04b0590变量的含义X=12XXX=90print(X)print(X+10)客人房间号变量命名规则字母、下划线和数字不能以数字开头名称组成要求区分大小写大小写要求不能使用系统关键字取名要求定义变量常用数据类型确定数据在内存中占多大地方告诉计算机如何处理这种数据数据类型的作用地址数据011203A0490常用数据类型String(字符串)Number(数字)List(列表)Dictionary(字典)整数:123浮点数:123.9用引号括起来的字符序列:'123'用[]括起来的一组任意对象的有序集合用{}括起来的一系列键值对运算符与优先级算术运算符比较(关系)运算符逻辑运算符赋值运算符比较运算:等于(==)不等于(!=)大于(>)小于(<)大于等于(>=)小于等于(<=)运算结果是True(真)或False(假)算术运算:加(+)减(-)乘(*)除(/)%(取模,除法计算后的余数)幂(**)//(取整除,除法计算后的商的整数部分)逻辑运算:逻辑与(and)逻辑或(or)逻辑非(not)运算结果是True或False变量赋值:一般赋值拆包式赋值运算符与优先级可以使用圆括号来改变运算优先级算术运算符比较运算符逻辑运算符赋值运算符输出格式第一步输入数据第二步处理数据第三步输出数据
=直接使用数值计算净资产收益率中国软件2023年第二季度项目2023/3/312023/6/30净利润-201692562.56-526350939.73期初净资产3560111655.873377181705.07期末净资产3377181705.073066567492.85
=使用变量计算净资产收益率中国软件2023年第二季度项目2023/3/312023/6/30净利润-201692562.56-526350939.73期初净资产3560111655.873377181705.07期末净资产3377181705.073066567492.85netProfitbeginNetAssetsendNetAssets
=使用键盘输入的数据计算净资产收益率中国软件2023年第一季度netProfitbeginNetAssetsendNetAssets程序执行到input()函数时会立即暂停,等待用户从键盘输入数据用户输入完成并以回车结束输入后,程序才会继续向下执行用户输入的内容以字符串形式作为input()的返回值返回到程序中,供程序后续使用该值参与计算input()函数项目2023/3/31净利润-201692562.56期初净资产3560111655.87期末净资产3377181705.07任务二使用列表计算企业净资产收益率相关知识列表列表的常见操作项目2023/3/312023/6/302023/9/302023/12/31净利润-201692562.56-526350939.73-439393891.20-7834747.02期初净资产3560111655.873377181705.073066567492.853055845394.83期末净资产3377181705.073066567492.853055845394.833429031128.43列表容器类型数据可存放多个数据一组任意对象的有序集合项目2023/3/312023/6/302023/9/302023/12/31净利润-201692562.56-526350939.73-439393891.20-7834747.02期初净资产3560111655.873377181705.073066567492.853055845394.83期末净资产3377181705.073066567492.853055845394.833429031128.43cSoftList4cSoftList3cSoftList2cSoftList1列表的常见操作提取列表中的元素增加列表中的元素修改列表中的元素删除列表中的元素项目2023/3/312023/6/302023/9/302023/12/31净利润-201692562.56-526350939.73-439393891.20-7834747.02期初净资产3560111655.873377181705.073066567492.853055845394.83期末净资产3377181705.073066567492.853055845394.833429031128.43访问列表元素索引方式切片方式从左到右的索引顺序是[0,n-1]访问形式:列表名[编号]切片形式:列表名[start:end:step]返回从第一个数字索引到第二个数字索引(不包括第二个数字索引的值)的一个列表切片增加、修改、删除列表元素增加删除append()方法追加到原列表的最后del语句既可删除列表中的单个元素也可删除列表中间的一段元素修改直接列表元素赋值项目2023/3/312023/6/302023/9/302023/12/31净利润-201692562.56-526350939.73-439393891.20-7834747.02期初净资产3560111655.873377181705.073066567492.853055845394.83期末净资产3377181705.073066567492.853055845394.833429031128.43使用列表计算企业净资产收益率使用列表存储第二、三、四季度的数据计算第二、三、四季度的净资产收益率计算第一季度的净资产收益率并将计算结果插入cSoftROE列表
[0][1][2]cSoftList2cSoftList3cSoftList4项目2023/3/312023/6/302023/9/302023/12/31净利润-201692562.56-526350939.73-439393891.20-7834747.02期初净资产3560111655.873377181705.073066567492.853055845394.83期末净资产3377181705.073066567492.853055845394.833429031128.43使用列表计算企业净资产收益率使用列表存储第二、三、四季度的数据计算第二、三、四季度的净资产收益率计算第一季度的净资产收益率并将计算结果插入cSoftROE列表cSoftList1[0][1][2]项目2023/3/312023/6/302023/9/302023/12/31净利润-201692562.56-526350939.73-439393891.20-7834747.02期初净资产3560111655.873377181705.073066567492.853055845394.83期末净资产3377181705.073066567492.853055845394.833429031128.43使用列表计算企业净资产收益率cSoftList1[0][1][2]cSoftROE第二季度净资产收益率第三季度净资产收益率第四季度净资产收益率cSoftROE.insert(0,temp)任务三使用字典计算净资产收益率的变化相关知识字典字典的常见操作数
据2022年2023年净利润244060018.6-7834747.02期初净资产3312422711.803560111655.87期末净资产3560111655.873429031128.43字典映射集合{key1:value1,key2:value2,…}
无序结构通过key访问value字典元素包括在一对花括号{}中花括号内是一系列的键值对(key:value)键和值之间用英文冒号(:)分隔多个键值对之间用英文逗号分隔{"Profit":-7834747.02,"beginAsset":3560111655.87,"endAsset":3429031128.43}字典key同一个字典中key必须唯一且不可变key可以是字符串和数字形式key用以指明value的含义value可以不唯一且可修改可以是任意数据类型{"Profit":-7834747.02,"beginAsset":3560111655.87,"endAsset":3429031128.43}字典定义字典访问字典元素key方式get()方法增加、修改、删除字典元素增加删除给字典中不存在的key赋值del语句用key指明要删除的key-value对修改对字典中存在的key重新赋值使用字典计算净资产收益率的变化数
据2022年2023年净利润244060018.6-7834747.02期初净资产3312422711.803560111655.87期末净资产3560111655.873429031128.43cSoftDictcSoftDict1["profit"]["beginAsset"]["endAsset"]用字典存储中国软件2022年和2023年的数据计算中国软件2022年和2023的净资产收益率并比较大小使用字典计算净资产收益率的变化数
据2022年2023年净利润244060018.6-7834747.02期初净资产3312422711.803560111655.87期末净资产3560111655.873429031128.43cSoftDictcSoftDict1["profit"]["beginAsset"]["endAsset"]用字典存储中国软件2022年和2023年的数据计算中国软件2022年和2023的净资产收益率并比较大小
项目四Python分支结构程序设计目标理解分支结构掌握单分支结构的用法掌握双分支结构的用法掌握多分支结构的用法任务一使用单分支语句比较中国软件
净资产收益率和行业平均值相关知识单分支结构if条件表达式:
语句块
条件表达式
成立(真)语句块不成立(假)单分支结构程序流程图单分支结构语法例如:x>2x<yx>2andx<y相关知识单分支结构
num1<num2成立(真)num1,num2=num2,num1不成立(假)if条件表达式:
语句块大小数交换程序流程图单分支结构语法大小数交换程序代码print("num1:",num1)print("num2:",num2)num1,num2=2,3使用单分支语句比较中国软件净资产收益率和行业平均值数
据2023年(中国软件)净利润-7834747.02期初净资产3560111655.87期末净资产3429031128.43cSoftDict["profit"]["beginAsset"]["endAsset"]存储中国软件2023年数据并计算净资产收益率比较中国软件2023年的净资产收益率和行业平均值使用单分支语句比较中国软件净资产收益率和行业平均值存储中国软件2019年数据并计算净资产收益率比较中国软件2019年的净资产收益率和行业平均值任务二使用双分支语句比较中国软件
净资产收益率和行业平均值相关知识双分支结构
条件表达式
成立(真)语句块1不成立(假)语句块2if条件表达式:
语句块1else:
语句块2双分支结构程序流程图双分支结构语法相关知识双分支结构使用双分支语句比较中国软件净资产收益率和行业平均值使用单分支语句比较使用双分支语句比较使用双分支语句比较中国软件净资产收益率和行业平均值使用单分支语句比较使用双分支语句比较任务三使用多分支语句比较中国软件
净资产收益率和行业平均值相关知识多分支结构if条件表达式1:
语句块1elif条件表达式2:
语句块2elif条件表达式3:
语句块3......else:
语句块n相关知识多分支结构使用多分支语句比较中国软件净资产收益率和行业平均值双分支多分支任务四比较中国软件、用友网络及行业
平均净资产收益率比较中国软件、用友网络及行业平均净资产收益率使用多分支语句比较中国软件和用友网络净资产收益率比较用友网络、中国软件及行业平均的净资产收益率数
据2023年(用友网络)2023年(中国软件)净利润-933238693.00-7834747.02期初净资产12518019618.003560111655.87期末净资产11803363222.003429031128.43cSoftDict["profit"]["beginAsset"]["endAsset"]UFSoftDict比较中国软件、用友网络及行业平均净资产收益率比较三者的净资产收益率逻辑运算符and:当and左右两边的值都为True时,结果才为True。只要有一个是False,结果就是False比较三者的净资产收益率2条路径2条路径4条路径总路径条数:2*2*4=16条路径项目五Python循环结构程序设计目标理解循环结构理解for循环和while循环的用法了解continue和break的用法任务一存储2020年到2023年的相关财报数据相关知识各年数据的存储全部数据的存储年
度2020年2021年2022年2023年净利润165010221.56202662270.20244060018.62-7834747.02期初净资产2761772535.392885521135.423312422711.803560111655.87期末净资产2885521135.423312422711.803560111655.873429031128.43各年数据的存储每年数据如何存储?年
度2020年2021年2022年2023年净利润165010221.56202662270.20244060018.62-7834747.02期初净资产2761772535.392885521135.423312422711.803560111655.87期末净资产2885521135.423312422711.803560111655.873429031128.43各年数据的存储每年数据如何存储?年
度2020年净利润165010221.56期初净资产2761772535.39期末净资产2885521135.42各年数据的存储每年数据存入一个字典年
度2020年2021年2022年2023年净利润165010221.56202662270.20244060018.62-7834747.02期初净资产2761772535.392885521135.423312422711.803560111655.87期末净资产2885521135.423312422711.803560111655.873429031128.43cSoftDict1cSoftDict2cSoftDict3cSoftDict4["profit"]["beginAsset"]["endAsset"]["period"]各年数据的存储每年数据存入一个字典
全部数据的存储用一个列表存储四个字典任务二使用for循环计算各年净资产收益率相关知识for循环range函数for循环控制语句块的重复执行for和in都是关键字迭代器是Python语言中的重要机制之一for循环变量in迭代器:
语句块
循环的控制结构,它控制for中语句块的执行次数循环体此处为缩进,缩进量通常为4个字符迭代器是一个值序列,或值集合迭代器中的值的个数就是for循环的次数for循环循环次数i值循环体10i的值为021i的值为132i的值为243i的值为3示例for循环循环次数i值循环体110i=10213i=13316i=16417i=17示例for循环循环次数item值循环体1’a’item=a2’b’item=b3’abc’item=abc4100item=100示例range()函数产生指定范围的一系列值常作为for循环的迭代器range(n)range(m,n)range(m,n,d)省略m和d,m=0,d=1序列:0,1,2,3,…,n-1,即从0至n(不包括n)n≤0的时候序列为空省略d,d=1序列:m,m+1,m+2,…,n-1,即从m至n(不包括n)m≥n时序列为空序列:m,m+d,m+2d,…,即从m开始,依次按步长值d递增(若d为负则递减),直至那个最接近但不包括n的等差值结束for循环示例一cSoftList1[3]cSoftList1[2]cSoftList1[1]年
度2020年净利润165010221.56期初净资产2761772535.39期末净资产2885521135.42cSoftList1[0]cSoftList10,1,2,32,31,3for循环示例二["period"]2020年["period"]2021年["profit"]165010221.56["profit"]202662270.20["beginAsset"]2761772535.39["beginAsset"]2885521135.42["endAsset"]2885521135.42["endAsset"]3312422711.80cSoftList2[1]cSoftList2[0]cSoftList20,1使用循环从列表cSoftList中提取数据"period"2020年"period"2021年"period"2022年"period"2023年"profit"165010221.56"profit"202662270.20"profit"244060018.62"profit"-7834747.02"beginAsset"2761772535.39"beginAsset"2885521135.42"beginAsset"3312422711.80"beginAsset"3560111655.87"endAsset"2885521135.42"endAsset"3312422711.80"endAsset"3560111655.87"endAsset"3429031128.43cSoftList[1]cSoftList[0]cSoftListcSoftList[3]cSoftList[2]keyvaluekeyvaluekeyvaluekeyvalue0,1,2,3使用循环从列表cSoftList中提取数据程序流程图使用循环从列表cSoftList中提取数据"period"2020年"period"2021年"period"2022年"period"2023年"profit"165010221.56"profit"202662270.20"profit"244060018.62"profit"-7834747.02"beginAsset"2761772535.39"beginAsset"2885521135.42"beginAsset"3312422711.80"beginAsset"3560111655.87"endAsset"2885521135.42"endAsset"3312422711.80"endAsset"3560111655.87"endAsset"3429031128.43cSoftList[1]cSoftList[0]cSoftListcSoftList[3]cSoftList[2]keyvaluekeyvaluekeyvaluekeyvalue2,30,2使用循环从列表cSoftList中提取年度数据"period"2020年"period"2021年"period"2022年"period"2023年"profit"165010221.56"profit"202662270.20"profit"244060018.62"profit"-7834747.02"beginAsset"2761772535.39"beginAsset"2885521135.42"beginAsset"3312422711.80"beginAsset"3560111655.87"endAsset"2885521135.42"endAsset"3312422711.80"endAsset"3560111655.87"endAsset"3429031128.43cSoftList[1]cSoftList[0]cSoftListcSoftList[3]cSoftList[2]keyvaluekeyvaluekeyvaluekeyvalue0,1,2,3cSoftList[0]cSoftList[1]cSoftList[2]cSoftList[3]cSoftList[0]cSoftList[1]cSoftList[2]cSoftList[3]使用循环提取2023年度的财报数据"period"2020年"period"2021年"period"2022年"period"2023年"profit"165010221.56"profit"202662270.20"profit"244060018.62"profit"-7834747.02"beginAsset"2761772535.39"beginAsset"2885521135.42"beginAsset"3312422711.80"beginAsset"3560111655.87"endAsset"2885521135.42"endAsset"3312422711.80"endAsset"3560111655.87"endAsset"3429031128.43cSoftList[1]cSoftList[0]cSoftListcSoftList[3]cSoftList[2]keyvaluekeyvaluekeyvaluekeyvaluecSoftList[0]cSoftList[1]cSoftList[2]cSoftList[3]使用循环提取2023年度的财报数据程序流程图cSoftList[0]cSoftList[1]cSoftList[2]cSoftList[3]计算每年的净资产收益率"period"2020年"period"2021年"period"2022年"period"2023年"profit"165010221.56"profit"202662270.20"profit"244060018.62"profit"-7834747.02"beginAsset"2761772535.39"beginAsset"2885521135.42"beginAsset"3312422711.80"beginAsset"3560111655.87"endAsset"2885521135.42"endAsset"3312422711.80"endAsset"3560111655.87"endAsset"3429031128.43cSoftList[1]cSoftList[0]cSoftListcSoftList[3]cSoftList[2]keyvaluekeyvaluekeyvaluekeyvalue
计算2023年的净资产收益率cSoftList[0]cSoftList[1]cSoftList[2]cSoftList[3]
计算公式:"period"2023年"profit"-7834747.02"beginAsset"3560111655.87"endAsset"3429031128.43cSoftList[3]keyvalue计算每年的净资产收益率"period"2020年"period"2021年"period"2022年"period"2023年"profit"165010221.56"profit"202662270.20"profit"244060018.62"profit"-7834747.02"beginAsset"2761772535.39"beginAsset"2885521135.42"beginAsset"3312422711.80"beginAsset"3560111655.87"endAsset"2885521135.42"endAsset"3312422711.80"endAsset"3560111655.87"endAsset"3429031128.43cSoftList[1]cSoftList[0]cSoftListcSoftList[3]cSoftList[2]keyvaluekeyvaluekeyvaluekeyvalue“ROE”0.0584386898“ROE”0.0653966138“ROE”0.0710247503“ROE”-0.002241977cSoftList[0]cSoftList[1]cSoftList[2]cSoftList[3]计算每年的净资产收益率"period"2020年"period"2021年"period"2022年"period"2023年"profit"165010221.56"profit"202662270.20"profit"244060018.62"profit"-7834747.02"beginAsset"2761772535.39"beginAsset"2885521135.42"beginAsset"3312422711.80"beginAsset"3560111655.87"endAsset"2885521135.42"endAsset"3312422711.80"endAsset"3560111655.87"endAsset"3429031128.43“ROE”0.0584386898“ROE”0.0653966138“ROE”0.0710247503“ROE”-0.002241977cSoftList[1]cSoftList[0]cSoftListcSoftList[3]cSoftList[2]keyvaluekeyvaluekeyvaluekeyvalue更新后的cSoftList任务三使用for循环比较净资产收益率的大小相关知识continue语句break语句continue语句在未执行完当前循环的情况下,提前结束本次循环,转去进行下一次新的循环continuerange(4):迭代对象range(0,4)list(range(4))[0,1,2,3]break语句结束当前循环,然后跳转到循环后的下一条语句继续执行break输出净资产收益率超过5%的年度"period"2020年"period"2021年"period"2022年"period"2023年"profit"165010221.56"profit"202662270.20"profit"244060018.62"profit"-7834747.02"beginAsset"2761772535.39"beginAsset"2885521135.42"beginAsset"3312422711.80"beginAsset"3560111655.87"endAsset"2885521135.42"endAsset"3312422711.80"endAsset"3560111655.87"endAsset"3429031128.43“ROE”0.0584386898“ROE”0.0653966138“ROE”0.0710247503“ROE”-0.002241977cSoftList[1]cSoftList[0]cSoftListcSoftList[3]cSoftList[2]keyvaluekeyvaluekeyvaluekeyvaluecSoftList[0][“ROE”]>=0.05cSoftList[1][“ROE”]>=0.05cSoftList[2][“ROE”]>=0.05cSoftList[3][“ROE”]>=0.05使用continue控制for循环"period"2020年"period"2021年"period"2022年"period"2023年"profit"165010221.56"profit"202662270.20"profit"244060018.62"profit"-7834747.02"beginAsset"2761772535.39"beginAsset"2885521135.42"beginAsset"3312422711.80"beginAsset"3560111655.87"endAsset"2885521135.42"endAsset"3312422711.80"endAsset"3560111655.87"endAsset"3429031128.43“ROE”0.0584386898“ROE”0.0653966138“ROE”0.0710247503“ROE”-0.002241977cSoftList[1]cSoftList[0]cSoftListcSoftList[3]cSoftList[2]keyvaluekeyvaluekeyvaluekeyvaluecSoftList[0][“ROE”]<0.05cSoftList[1][“ROE”]<0.05cSoftList[2][“ROE”]<0.05cSoftList[3][“ROE”]<0.05使用continue控制for循环程序流程图输出第一个净资产收益率超过5%的年度及净资产收益率"period"2020年"period"2021年"period"2022年"period"2023年"profit"165010221.56"profit"202662270.20"profit"244060018.62"profit"-7834747.02"beginAsset"2761772535.39"beginAsset"2885521135.42"beginAsset"3312422711.80"beginAsset"3560111655.87"endAsset"2885521135.42"endAsset"3312422711.80"endAsset"3560111655.87"endAsset"3429031128.43“ROE”0.0584386898“ROE”0.0653966138“ROE”0.0710247503“ROE”-0.002241977cSoftList[1]cSoftList[0]cSoftListcSoftList[3]cSoftList[2]keyvaluekeyvaluekeyvaluekeyvaluecSoftList[0][“ROE”]>=0.05cSoftList[1][“ROE”]>=0.05cSoftList[2][“ROE”]>=0.05cSoftList[3][“ROE”]>=0.05输出第一个净资产收益率超过5%的年度及净资产收益率程序流程图任务四使用while循环比较相邻年度净资产收益率的变化相关知识while循环while循环的注意事项while循环控制语句块的重复执行条件为真时执行语句块
语句块执行结束再去判断while条件
直到条件表达式值为假时结束循环while
条件表达式:
语句块循环的控制结构,控制循环是否运行循环体此处为缩进,缩进量通常为4个字符条件表达式的值:真值或假值while循环示例cSoftList1[0]2020年cSoftList1[1]165010221.56cSoftList1[2]2761772535.39cSoftList1[3]2885521135.42cSoftList1循环条件判断次数i值循环条件是否运行循环print(cSoftList1[i])i=i+1100<4为真是cSoftList1[0]i=1211<4为真是cSoftList1[1]i=2322<4为真是cSoftList1[2]i=3433<4为真是cSoftList1[3]i=4544<4为假否
比较相邻年度净资产收益率的变化"period"2020年"period"2021年"period"2022年"period"2023年"profit"165010221.56"profit"202662270.20"profit"244060018.62"profit"-7834747.02"beginAsset"2761772535.39"beginAsset"2885521135.42"beginAsset"3312422711.80"beginAsset"3560111655.87"endAsset"2885521135.42"endAsset"3312422711.80"endAsset"3560111655.87"endAsset"3429031128.43“ROE”0.0584386898“ROE”0.0653966138“ROE”0.0710247503“ROE”-0.002241977cSoftList[1]cSoftList[0]cSoftListcSoftList[3]cSoftList[2]keyvaluekeyvaluekeyvaluekeyvalueprePeriod=cSoftList[0]["period"]preROE=cSoftList[0]["ROE"]period=cSoftList[1]["period"]roe=cSoftList[1]["ROE"]prePeriod=cSoftList[1]["period"]preROE=cSoftList[1]["ROE"]period=cSoftList[2]["period"]roe=cSoftList[2]["ROE"]prePeriod=cSoftList[2]["period"]preROE=cSoftList[2]["ROE"]period=cSoftList[3]["period"]roe=cSoftList[3]["ROE"]比较相邻年度净资产收益率的变化"period"2020年"period"2021年"period"2022年"period"2023年"profit"165010221.56"profit"202662270.20"profit"244060018.62"profit"-7834747.02"beginAsset"2761772535.39"beginAsset"2885521135.42"beginAsset"3312422711.80"beginAsset"3560111655.87"endAsset"2885521135.42"endAsset"3312422711.80"endAsset"3560111655.87"endAsset"3429031128.43“ROE”0.0584386898“ROE”0.0653966138“ROE”0.0710247503“ROE”-0.002241977cSoftList[1]cSoftList[0]cSoftListcSoftList[3]cSoftList[2]keyvaluekeyvaluekeyvaluekeyvalue2020年2021年2021年比较相邻年度净资产收益率的变化"period"2016"period"2017"period"2018"period"2019"profit"118506980.11"profit"61470394.48"profit"128629620.06"profit"141738761.38"beginAsset"2813478299.78"beginAsset"2908311215.34"beginAsset"2523529533.83"beginAsset"2605401549.65"endAsset"2908311215.34"endAsset"2523529533.83"endAsset"2605401549.65"endAsset"2761772535.39“ROE”0.04142304773“ROE”0.02263335665“ROE”0.05015845132“ROE”0.05281690481cSoftList[1]cSoftList[0]cSoftListcSoftList[3]cSoftList[2]keyvaluekeyvaluekeyvaluekeyvalue2022年2021年2022年比较相邻年度净资产收益率的变化"period"2016"period"2017"period"2018"period"2019"profit"118506980.11"profit"61470394.48"profit"128629620.06"profit"141738761.38"beginAsset"2813478299.78"beginAsset"2908311215.34"beginAsset"2523529533.83"beginAsset"2605401549.65"endAsset"2908311215.34"endAsset"2523529533.83"endAsset"2605401549.65"endAsset"2761772535.39“ROE”0.04142304773“ROE”0.02263335665“ROE”0.05015845132“ROE”0.05281690481cSoftList[1]cSoftList[0]cSoftListcSoftList[3]cSoftList[2]keyvaluekeyvaluekeyvaluekeyvalue2023年2022年2023年项目六数据分析工具Pandas入门回顾什么是数据分析数据分析是指根据事先确定的分析目标,选择适当的统计分析方法或工具,对收集来的大量数据进行处理与分析,从中提取有价值的信息,形成分析结论。分析结果可以辅助企业进行管理优化、预测和决策。数据分析的流程企业利用大数据进行经营管理和辅助预决策时,大致需要以下四个步骤:数据获取、数据预处理、数据分析、数据可视化等环节。回顾目标掌握Pandas的两种数据结构掌握Pandas索引的相关操作掌握Pandas的常见操作掌握读写数据的方法任务一使用Pandas操作中国软件财报数据Pandas再论Anaconda集成了常用的数据分析工具:Pandas、matplotlib等。Pandas是当前Python数据分析中最为重要的工具,其提供了功能强大且灵活多样的高级函数,极大地简化了数据处理的流程,可以满足使用者在数据分析和处理中的多种选择和实现方式。Pandas包Python之所以功能强大就是因为有非常丰富的第三方包(库),将这些包引入到程序中,就可以很方便地使用包中提供的功能。(想想数学中的sin函数)使用Pandas前需要先导入Pandas包。importpandasaspd此代码用于在当前程序中导入pandas包,并为该包起别名pd。后续在程序中若要使用Pandas,可直接用别名pd代替Pandas数据结构Pandas中有两个主要的数据结构:Series和DataFrame数据结构是计算机存储、组织数据的方式Series一维的数据结构DataFrame二维的、表格型的数据结构Pandas数据结构SeriesSeries是一维数据结构,它能够保存任何类型的数据,如整数、字符串、浮点数。Series对象主要由一组数据和与之相关的标签(索引)构成。DataFrameDataFrame是一种表格型的数据结构,既有行索引index,也有列索引columns。其实可以简单把DataFrame理解为一张数据表。了解Series数据结构带有标签的数据结构,由数据和索引组成使用默认索引创建Series对象索引数据Series数据结构使用自定义索引创建Series对象自定义索引数据Series数据结构使用字典创建Series对象字典数据,字典的键作为索引他们是键Series数据结构输出Series对象的索引和数据了解DataFrame数据结构带有标签的数据结构,由数据和行索引、列索引组成使用默认索引创建DataFrame对象DataFrame数据结构使用自定义索引创建DataFrame对象列标题行标题DataFrame数据结构使用字典形式创建DataFrame对象说明:字典的键自动作为列索引。DataFrame数据结构为行列索引添加名称Pandas读写数据数据采集后一般都会存储到本地硬盘中,不会将数据直接写入到程序中,这样不仅造成程序代码臃肿,而且可用率很低。所以当我们进行数据分析时需要对存储的文件进行读取。Pandas可以读取文本文件、Excel文件、网页文件和数据库文件。我们以财务数据处理中常用的Excel文件为例讲解文件的读取。Pandas读写数据读取Excel文件Pandas提供了read_excel()函数来读取Excel文件,读取到的数据自动转换成DataFrame类型的数据要读取的文件左边第3行代码中将“data.xlsx”文件中的数据读入程序赋值给变量UFSoftDF,UFSoftDF是什么类型呢?答案:是DataFrame类型Pandas读写数据保存Excel文件保存文件的函数保存到外部的文件名Pandas读写数据继续探讨UFSoftDF的数据类型怎样查看UFSoftDF的数据类型呢?importpandasaspdUFSoftDF=pd.read_csv(‘data.xlsx’)print(type(UFSoftDF))#输出UFSoftDF的类型培养读者的程序思维任务二查询中国软件资产负债表数据数据查询一个数据集中的数据量通常都是比较大的,学会如何从大量数据中查询自己需要的数据是一个很重要的技能一、查询Series数据查询单个数据使用切片查询数据(连续的多个数据)查询不连续的数据
对象名[
索引|标签名|切片|列表]一、查询Series数据查询单个数据一、查询Series数据查询切片数据一、查询Series数据查询不连续的数据说明:不连续的标签索引,多个索引值要用列表表示。二、查询DataFrame数据以下列DataFrame对象为例说明:np.random.rand(8,4),返回一个8行4列的0~1之间的随机数。二、查询DataFrame数据使用“对象名[列索引]”的方式获取DataFrame对象的一列数据使用“对象名[[列索引1,列索引2,…]]”的方式来获取多列数据二、查询DataFrame数据使用“对象名[行索引1:行索引2]”的方式来获取DataFrame对象的一行或多行数据二、查询DataFrame数据使用“对象名[列索引][行索引]”的方式获取DataFrame对象的某一个值或某个矩形区域的值(即行列交叉部分的值)说明:DataFrame直接索引只支持先列后行,不支持先行后列。原理如左图所示。二、查询DataFrame数据获取整体信息三、使用loc方法和iloc方法获取DataFrame数据更加灵活的解决办法:loc方法:按照标签索引(名称)选取数据iloc方法:按照位置索引(整数索引)选取数据loc[行名,列名]iloc[行号,列号]注意:loc和iloc后面是方括号,其中行、列可以是单一值,也可以是切片,还可以是列表。如果要获取a到d行的B、D两列的数据,代码如何写?df[['B','D']]['a':'d']使用loc方法注意:列省略表示取所有列。三、使用loc方法和iloc方法获取DataFrame数据使用iloc方法说明:(1)位置编号均从0开始顺序编号(2)位置索引也是类似a[x,y]形式,而x和y可以有多种不同的写法三、使用loc方法和iloc方法获取DataFrame数据loc和iloc方法小结宏观上看是a[x,y]形式,而x和y可以有多种不同的写法df.loc[‘a’:’c’,[‘A’,’C’]]#a行到c行的A列和C列df.iloc[:5,[0,2]]#0到5行的第0列和第2列df.loc[:,[‘A’,’C’]]#所有行的A列和C列df.iloc[:,[0,2]]#所有行的第0列和第2列项目七统计计算与分组运算目标掌握Pandas的统计运算方法掌握Pandas的排序操作掌握Pandas分组统计方法任务一MG公司2023年销售数据的统计计算相关知识_常见的统计函数求最大值和最小值:max()、min()函数求均值:mean()函数求和:sum()函数统计描述函数:describe()函数常见的统计函数以文件profits.xlsx中的数据为例进行一些常见的统计计算求最大值和最小值说明:省略max()和min()函数的axis参数时,默认axis=0,表示按列纵向求最大或最小值。当axis=1时,表示按行求每行的最大或最小值。注意计算时对所有列(或行)进行计算。求均值说明:mean()函数表示求均值,DataFrame的统计函数中都默认优先按列纵向计算,如果需要对每行的数据计算,在调用这些统计函数时,设置axis=1即可。按列计算按行计算求和说明:本次求和的结果作为新的一行,添加到profitDF数据集的末尾。当loc方法的行标签参数是数据集中不存在的标签时,将在数据集中增加对应的标签。如果直接求和,执行profitDF.sum()代码,结果会是什么样的?
统计描述函数说明:1.可以一次性完成多个统计指标计算。2.该函数输出了数据集的count(行数)、mean(平均值)、std(标准差)、min(最小值)、25%(第一四分位数)、50%(第二四分位数)、75%(第三四分位数)、max(最大值)3.该函数在分析一个较大的文件时,作为初步的分析工具是非常有用的describe()函数任务二MG公司2023年销售数据的排序相关知识数据排序:按索引名排序、按值排序分位数函数:quantile()函数按索引名排序sort_index()方法专门用于按数据集的索引标签名进行排序按值排
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 铺面装修包工合同范本
- 服装展示培训合同范本
- 必修不等式知识点总结
- 房屋按揭转让合同范本
- 风电基础合同范本
- 房产开发合作合同范本
- 企业形象与品牌塑造策略研究
- 初中教师培训
- 中学生自我兴趣探索与成长策略
- 企业国际化战略与管理模式
- 小生生科普知识讲座:航天探索
- DeepSeek在海洋资源开发中的应用潜力
- 腹外疝围手术期护理
- 课件:德国鲁尔区的工业遗产与转型
- 中国近现代史纲要学习心得体会对青少年成长的影响
- 新租赁准则培训课件
- 制作纸杯蛋糕(课件)全国通用六年级下册综合实践活动
- 幼儿园食谱播报
- 预拌混凝土及原材料检测理论考试题库(含答案)
- PR6C系列数控液压板料折弯机 使用说明书
- 消防安全宣传培训记录
评论
0/150
提交评论