版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
湖南商务职业技术学院毕业设计
目录
1引言............................................................................................................................1
1.1项目背景......................................................................................................1
1.2开发环境与工具..........................................................................................2
1.2.1Python简介..........................................................................................2
1.2.2Jupyternotebook简介......................................................................2
1.2.3Python第三方库简介..........................................................................3
2需求分析....................................................................................................................4
2.1可行性需求分析..........................................................................................4
2.2采集目标功能分析......................................................................................5
2.3关键技术分析..............................................................................................5
2.3.1网络爬虫技术.......................................................................................5
2.3.2可视化技术...........................................................................................6
3数据采集....................................................................................................................6
3.1采集页面分析..............................................................................................6
3.2字段分析......................................................................................................8
3.3编程实现......................................................................................................9
4数据清洗与处理......................................................................................................11
5数据统计与分析......................................................................................................12
5.1数据统计....................................................................................................12
5.2数据分析....................................................................................................13
5.3数据展示....................................................................................................15
5.3.1蔬菜产地信息统计.............................................................................15
5.3.2蔬菜规格统计.....................................................................................17
5.3.3红尖椒与线椒的最高价、最低价、平均价随日期的变化趋势统计
分析18
5.3.4对蔬菜产地以及品名进行统计.........................................................20
5.4综述............................................................................................................21
I
湖南商务职业技术学院毕业设计
6小结..........................................................................................................................21
参考资料.........................................................................................................................22
II
湖南商务职业技术学院毕业设计
基于Python的北京新发地网数据采集与分析
1引言
时光荏苒,如今的中国正处在蓬勃发展的历史时期。移动互联网时代的到
来,开启了信息革命的新篇章。随着各种技术应用的不断涌现,计算机互联网
技术中的云计算、大数据、物联网、智能技术等已经成为了人们智能生活的重
要基石。同时,人们的日常生活所产生的大量数据,例如在食衣住行、卫生医
疗等方面,已经成为了大家学习和开发的宝贵资源。
其中,蔬菜市场是一个非常重要的领域。如今,蔬菜市场的供应链已经越
来越复杂,而且受到各种因素的影响,例如气候变化、生产成本等。因此,如
何优化蔬菜市场供应链并提高效率,已成为摆在面前的一个重要问题。数据科
学和大数据技术正是解决这一问题的有力工具,可以通过数据挖掘、分析和可
视化等手段,深入了解蔬菜市场的运作规律和消费者需求,为市场的进一步发
展提供有力支持。因此,深入研究蔬菜市场数据,并利用数据科学和大数据技
术探索其发展趋势和前景是有必要的。
1.1项目背景
随着经济的发展和城市化进程的不断推进,蔬菜市场也随之不断扩大和变
化。了解蔬菜市场的供需情况以及价格变化趋势对于政府、农民和消费者都具
有重要的意义。然而,蔬菜市场的供求关系和价格变化受到多种因素的影响,
因此需要通过科学的方法对其进行研究和分析。
北京新发地批发市场是中国最大的农产品交易市场之一,其网站是北京市
农业农村局和北京市商务局共同建设和运营的官方网站。该网站提供了包括蔬
菜、水果、肉类等各种农产品的价格信息、交易信息、行业资讯等服务。然而,
这些数据只能在网站上查看,无法方便地进行数据分析和处理。因此,对于有
需要对北京市农产品市场进行研究的学者和企业,如何方便地获取和处理这些
数据成为了一个关键问题。因此,本毕业设计旨在通过开发一个蔬菜网站爬虫
和数据处理工具,对新发地蔬菜价格进行数据采集、处理和分析,为有关部门、
企业及学者提供数据支持,同时也能够为新发地蔬菜市场的发展提供参考。
1
湖南商务职业技术学院毕业设计
1.2开发环境与工具
1.2.1Python简介
计算机领域,Python是一门备受欢迎的编程语言。Python由荷兰的龟叔
(GuidoRossum)在20世纪80年代末创建,最初并未引起太多关注。但随着21
世纪初Google大规模应用Python,这门语言也开始进入人们的视野并快速发展
起来。
Python的简洁、易学、多用途等特点,让它成为编程入门者和专业开发者
的热门选择。
近年来,随着计算机技术的飞速发展,移动互联网、大数据、云计算等新
兴技术也开始崛起。Python在这些领域中也开始发挥重要作用,成为数据科学
家、Web开发人员、自动化测试工程师等职业领域的首选编程语言。同时,由于
Python语言的易读性、可维护性、丰富的第三方库等特点,它也成为了人工智
能、机器学习、深度学习等领域的首选编程语言。
Python语言具有跨平台性和易移植性,它可以在Windows、MacOS、Linux
等操作系统上运行,并且支持多种编译器和开发环境。此外,Python还拥有丰
富的开发工具和IDE,如JupyterNotebook、PyCharm等,为开发者提供了便捷
和高效的开发体验。
Python社区活跃,拥有大量的优秀开源项目和第三方库,这些资源能够极
大地提高开发效率和编程体验。在Python社区,不仅可以学习到编程基础和高
级技术,还能够结识一群志同道合的编程爱好者和专业开发者,共同交流、学
习和成长。
总之,Python是一门简单易学、功能强大、广泛应用的编程语言,无论是
从入门者到专业开发者,都能够从中受益匪浅。
1.2.2Jupyternotebook简介
Jupyternotebook是一种基于网页的交互式计算环境,被广泛应用于数据分
析、数据可视化、科学计算、教育等领域。它的优势在于能够将代码、文本、
图像、音频、视频等多种媒介类型整合在同一个文档中,使得数据分析过程更
加流畅和直观。
使用Jupyternotebook可以轻松地探索数据、执行分析、并生成可交互的
报告。与传统的编程环境相比,Jupyternotebook更加灵活,具有更高的可视
2
湖南商务职业技术学院毕业设计
化性和可交互性,让用户可以更加方便地理解数据背后的规律。
Jupyternotebook支持多种编程语言,包括Python、R、Julia等,但目前
最常用的还是Python。对于初学者来说,Jupyternotebook可以帮助他们快速
掌握Python编程语言,以及如何应用Python进行数据分析。
Jupyternotebook也广泛用于数据科学竞赛、科研项目、教育等领域。许
多大型科技公司如Google、IBM、微软等也在使用Jupyternotebook进行数据
分析和研究。因为Jupyternotebook是开源的,拥有庞大的社区支持,用户可
以使用各种第三方库来扩展其功能。
总之,Jupyternotebook是一种非常有用的数据分析工具,它可以帮助用
户更好地理解数据、提高工作效率,并为数据分析领域的研究和应用提供了便
利。
1.2.3Python第三方库简介
Pandas:
Pandas是Python中最常用的数据分析和处理工具之一,它可以对数据进行
快速和灵活的操作和处理。Pandas提供了大量的数据处理功能,包括数据读取、
数据清洗、数据变换和数据聚合等,同时还可以用于处理缺失值、数据合并和
数据可视化等。Pandas还支持多种数据类型,包括Series、DataFrame和Panel
等,可以轻松地处理不同维度的数据。
NumPy:
NumPy是Python中科学计算的基础库之一,它提供了高效的多维数组和矩
阵运算功能,是许多数据分析和科学计算领域的重要工具。NumPy支持多种数据
类型和数据结构,包括数组、矩阵、记录数组和结构数组等,可以用于数值计
算、线性代数、傅里叶变换、随机数生成和数据处理等。NumPy还提供了许多高
效的数值算法和函数,包括排序、统计和聚合等。
Matplotlib:
Matplotlib是Python中最常用的数据可视化工具之一,它提供了丰富的绘
图功能,可以用于生成各种类型的静态和动态图表。Matplotlib支持多种绘图
类型,包括线图、散点图、柱状图、饼图、等高线图和三维图等,可以用于生
成简单的图形和复杂的可视化效果。Matplotlib还支持多种输出格式和交互式
绘图功能,可以满足不同领域和应用的需求。
Seaborn:
Seaborn是Python中基于Matplotlib的高级数据可视化工具之一,它提供
3
湖南商务职业技术学院毕业设计
了更加简单和美观的绘图接口,可以用于生成各种类型的统计图表和数据可视
化效果。Seaborn支持多种绘图类型,包括分布图、热力图、聚类图、回归图和
分面绘图等,可以用于探索数据分布、发现数据间的关系和展示数据的特征。
Seaborn还提供了多种可调参数和样式选项,可以定制绘图效果和风格。
Jeiba:
Jieba库是一种用于中文分词的Python库,其主要功能是将一段中文文本
切分成一个一个的单词(也称为词语或词汇)。Jieba库使用基于字典的分词算
法,结合了中文语言学特点和自然语言处理领域的一些技术,具有高效、精确、
可定制化等优点。除了分词外,Jieba库还支持关键词提取、词性标注、繁简体
转换等功能,可广泛应用于自然语言处理、信息检索、文本挖掘等领域。Jieba
库的作者是fxsjy,已被广泛应用于各类中文文本处理场景中。
2需求分析
2.1可行性需求分析
1、技术可行性
首先,通过设定要爬取的页数,循环爬取每一页的商品信息。发送POST请
求的URL为'/getPriceData.html',请求体为一个
包含limit、current和prodPcatid参数的字典。其中limit参数代表每页商
品数量,current参数代表当前页数,prodPcatid参数代表商品类别ID。headers
为请求头信息,用于伪装成浏览器发送请求,避免被反爬机制阻挡。
接着,解析返回的JSON数据,提取商品信息并保存到字典中。字典包含品
名、最低价、最高价、平均价、规格、产地、单位和发布日期等信息。将商品
信息添加到总列表中,以便后续保存到Excel文件。
最后,使用pandas库创建DataFrame对象,将总列表中的商品信息保存到
Excel文件'vegetable_prices.xlsx'中,其中index=False表示不保存索引列。
通过这段代码,可以爬取新发地菜价网站的蔬菜价格信息,并将其保存到本地
Excel文件中,方便后续的数据分析和可视化。
2、项目可行性
本次项目旨在通过爬取新发地农产品交易网站的蔬菜价格信息,分析蔬菜
价格的变化趋势和波动情况,为农产品市场研究提供数据支持和决策参考。本
项目的可行性主要表现在以下几个方面:
首先,新发地农产品交易网站是国内知名的农产品交易平台之一,发布的
4
湖南商务职业技术学院毕业设计
蔬菜价格信息具有权威性和可靠性,能够满足本项目的数据需求。
其次,本项目使用Python编写爬虫程序获取数据,使用pandas库进行数
据清洗和预处理,使用matplotlib库进行数据可视化,这些技术在数据分析领
域得到了广泛应用,且具有较高的稳定性和可扩展性。
最后,本项目的数据处理主要包括数据清洗、数据整合、数据分析和数据
可视化等步骤,通过对数据的处理和分析,能够得出对蔬菜价格变化趋势和波
动情况的清晰认识,为农产品市场研究提供参考。
综上所述,本项目具有明确的数据来源、技术可行性和数据处理可行性,
能够有效地分析蔬菜价格的变化趋势和波动情况,为农产品市场研究提供有价
值的数据支持。
2.2采集目标功能分析
本次项目的数据集来源于北京新发地网站,是通过Python爬取蔬菜价格信
息。通过数据清洗后,爬取完成后尽可能的检查数据的准确性,确定爬取出来的
数据无误并且是属于蔬菜价格信息网站实时存在的蔬菜价格信息。
分析蔬菜价格信息网站,明确需要爬取的蔬菜参数有蔬菜品种、日期、批发
价、零售价、规格、产地、单位等数据。在对原始数据进行预处理后,本项目会
对其数据进行多个维度的分析。例如,从不同蔬菜品种的价格对其进行分析,查
看每种蔬菜的价格变化趋势。又或者想要得到每个蔬菜品种的产地分布情况,那
么就可以根据产地信息对其进行统计和可视化,以便于直观地了解不同地区的
蔬菜供应情况。同时,本项目还可以对不同规格、不同日期等数据进行分析和可
视化,以便于更深入的探究蔬菜价格信息背后的规律。
2.3关键技术分析
2.3.1网络爬虫技术
本项目使用了网络爬虫技术和相关工具,实现了自动化抓取网页数据的功
能。网络爬虫基于HTTP协议,通过模拟浏览器行为向目标网站发送请求,获取
网页数据。本项目使用了Scrapy框架和BeautifulSoup库进行网页解析和数据
提取,同时也使用了Selenium工具模拟浏览器行为。这些工具具有高效、可扩
展、模块化等特点,为数据采集提供了强大的支持。
在使用网络爬虫技术进行数据采集时,需要注意相关的法律法规,如遵循
网站的robots.txt协议等。此外,如果采集的网站有相关的反爬机制,可能会
5
湖南商务职业技术学院毕业设计
面临被封IP地址或账号、数据采集速度受限等问题。因此,在使用网络爬虫技
术时,需要进行合理规划和设计,以确保数据采集的顺利进行。同时爬虫技术
应该被广泛讨论和研究,以找到合适的应用场景和规范。总的来说,爬虫技术
的发展应该是与法律法规相适应的,同时应该注重个人隐私的保护。与此同时,
大家也应该意识到,随着互联网信息的增长,数据采集与利用将变得越来越重
要,未来可能也会涌现出更多的数据采集技术。大家需要在技术、法律和伦理
等方面保持敏感,为数据采集的健康发展做出应有的贡献。
2.3.2可视化技术
在进行数据处理和分析时,数据可视化技术是非常有用的。这种技术通过
将大量数据以图形的形式呈现出来,能够帮助人们更好地理解和分析数据,从
而得出相关结论。可视化技术已经成为现代数据分析的重要组成部分,能够让
人们更快、更准确地理解数据,并帮助做出更明智的决策。在本次蔬菜网站项
目中采用了Python第三方库Matplotlib来进行数据可视化。
Matplotlib提供了许多种类型的可视化图形,如饼图、条形图、直方图、
折线图等等。在进行数据分类和处理后,本项目使用了Matplotlib中的多种图
形来展示数据,如词云图、蔬菜规格展示图、对产地和品名做计数的图表、以
及红尖椒和线椒的最高价、最低价和平均价随日期的变化趋势图表等等。通过
这些图形,可以直观地了解数据的特征和关系,并最终得出结论。信息可视化
是可视化技术的一个重要分支,它主要处理非结构化、非几何的抽象数据,如
金融交易、社交网络和文本数据等。信息可视化面临的主要挑战是如何应对大
规模、高维度和复杂数据的视觉混淆,以减少对信息的干扰,从而更好地理解
和分析数据。通过本次项目的经验,可以看到数据可视化技术对于现代数据分
析的重要性和作用。在今后的数据处理和分析中,大家也应该充分发挥数据可
视化技术的作用,以更好地理解和利用数据。
3数据采集
3.1采集页面分析
本项目首先通过谷歌浏览器搜索北京新发地的官方网页,然后找到信息中
心的价格行情页面观察图3-1,其中URL为:
/priceDetail.html然后点击页面下方的分页按钮,
同时观察URL,发现URL没有变化。
6
湖南商务职业技术学院毕业设计
图3-1数据网址页面
按F12调出开发者工具,刷新页面,如图3-1。
图3-2开发者工具
利用全局搜索工具定位所需数据位置,点击开发者工具上面的Headers字
段,分析这是个什么请求,发现这个是一个POST请求,然后需要寻找它的from
data往下翻找,在最后找到表单数据FormData,如图3-3。
7
湖南商务职业技术学院毕业设计
图3-3FormData
3.2字段分析
在爬取北京新发地农产品交易网站的数据时,需要先打开该网站并通过开
发者工具分析页面结构,以定位到所需数据所在的位置。在网页上方的搜索栏
中输入关键词“新发地批发市场”,点击搜索按钮,跳转到新的页面。在该页
面中找到“今日价格”、“历史价格”等数据,并点击“历史价格”选项卡。
在页面上方的工具栏中选择“网络”选项卡,通过开发者工具可发现该页面使
用了POST方法获取数据,并将响应以JSON格式传递回客户端。因此,需要使
用Python中的requests库来发送POST请求来获取数据。同时,为了避免被封
禁,需要注意网站的反爬措施,如限制访问频率、要求登录等,并设置适当的
请求头和访问频率限制。
获取到数据后,需要进行字段分析,以提取所需数据。在该网站中,每个
品种都有名称、日期、规格、最高价、最低价、平均价、交易量、单位等字段。
需要将这些字段保存在xlsx文件中,以便后续分析和处理。
在对蔬菜网站进行字段分析的过程中,需要先打开该网站并进入到目标页
面,然后通过开发者工具查看该页面所对应的HTML代码,并找到目标数据所在
的位置。接着,对目标数据所在的位置进行了分析,发现该网站通过JavaScrip
动态加载数据,数据是通过Ajax请求从服务器端返回的JSON格式数据。因此,
需要通过分析请求参数和响应数据来得到目标数据。
使用开发者工具中的“网络”功能查看了该网站的Ajax请求,并对请求参
数和响应数据进行了分析,发现请求参数中包含了当前页数、每页数据条数和
8
湖南商务职业技术学院毕业设计
搜索关键词等信息,响应数据则是以JSON格式返回了包含多条蔬菜数据的列表,
每条数据包含了蔬菜名称、规格、价格、产地、发布日期等多个字段。
最后,根据对请求参数和响应数据的分析,编写Python爬虫程序,使用
Requests库发送Ajax请求获取响应数据,并使用BeautifulSoup库解析HTML
代码和json库解析JSON格式数据,最终将所需字段存储在xlsx格式文件中。
图3-4分析数据类型页面
3.3编程实现
导入所需库。
图3-5导入所需库页面
设置请求头,伪装成浏览器访问服务器。
9
湖南商务职业技术学院毕业设计
图3-6请求头内容页面
代码实现如下:
10
湖南商务职业技术学院毕业设计
图3-7代码实现页面
4数据清洗与处理
在本项目中,获得了大量的数据集之后,需要对数据进行预处理,以确保
数据的一致性和信息质量的评估。这一预处理过程包括数据清洗和检查,以确
定是否存在无效值和缺失值。此外,还需要对数据进行有理化和有序化,以方
便开发人员在数据调用和共享过程中使用。
具体而言,本项目需要对爬取的数据和网页原数据进行比对,并检查是否
存在空值、错值等问题。同时,还需要验证数据的位置是否正确,并根据不同
的需求对数据进行不同的处理。这一预处理过程是非常重要的,可以保证数据
的质量和可用性,为后续的数据分析和应用提供基础。
图4-1数据清洗准备页面
图4-2数据清洗页面
经过比对和检查,发现数据存在规格有660个缺失值,产地有189个缺失值,
11
湖南商务职业技术学院毕业设计
这两个变量在后续研究中只看比较关系,所以无需填充,留存后续作为统计分
析、可视化使用。
图4-3数据清洗完成界面
5数据统计与分析
5.1数据统计
查看规格包含具体种类:
图5-1查看种类
查看规格列各种类出现的次数:
图5-2查看次数
12
湖南商务职业技术学院毕业设计
查看每一列的数据类型:
图5-3查看数据类型
5.2数据分析
图5-4查看最高价的平均值、众数、方差
通过图5-4对蔬菜最高价的平均值、众数、方差的分析,可以发现蔬菜的
最高价整体上呈现出一定的波动性,其中最高价的平均值约为4.245,说明在整
个蔬菜价格的分布中,最高价的平均水平处于一个相对较高的位置。同时,最
高价的众数为4.0,表明在最高价的数据中,以4元/斤的价格出现的最为频繁。
最高价的方差约为5.807,说明最高价数据的分散程度相对较大,具有一定的不
确定性。这些结果为深入了解蔬菜市场价格提供了重要的参考。
图5-5查看最低阶的平均值、众数、方差
通过图5-5的分析,可以看到最低价的平均值约为3.307,说明在观察时间
段内,蔬菜的最低价格整体上呈现出一个相对较低的趋势,平均来说价格相对
较稳定。最低价的众数为3.0,表示最低价在3元左右的时间段内出现的频率最
高,这个结果可以让人对市场情况有一个大致的了解,也能帮助农民和批发商
13
湖南商务职业技术学院毕业设计
在选购蔬菜时进行参考。最低价的方差约为4.165,这个数值可以表示数据分布
的离散程度,越大表示数据分布越分散,反之则表示数据越集中。在本次数据
分析中,最低价的方差不是很大,说明最低价的数据分布相对集中,这也可以
反映市场对最低价的整体控制力比较强。
图5-6查看平均价的平均值、众数、方差
通过图5-6的分析,平均价的平均数约为3.776,众数为4.25,方差约为
4.785,表明在该蔬菜市场的价格分布中,平均价的整体水平较为平均,但是存
在一些高价或低价的离群点。同时,平均价的众数为4.25,说明在该市场中,
以4.25元/斤的价格出售的蔬菜最为普遍,反映了该蔬菜品种的主流市场需求。
方差值约为4.786,说明该市场的蔬菜价格波动较大,可能存在一些不稳定的市
场因素,这也为市场参与者提供了更多的投资和风险管理方面的思考。
14
湖南商务职业技术学院毕业设计
5.3数据展示
5.3.1蔬菜产地信息统计
图5-7代码展示页面
15
湖南商务职业技术学院毕业设计
图5-8数据展示页面
通过图5-8对蔬菜产地信息的分析,可发现主要集中在冀、鲁、辽、云等
省份。这些地区拥有广阔的耕地和优良的自然条件,可生产出丰富多样的蔬菜。
同时,这些省份也是中国人口密集的地区,蔬菜的销售市场非常广阔,这也促
进了这些地区蔬菜生产的发展。
蔬菜生产的地域性比较明显,不同省份的蔬菜种类也有所不同。例如,辽
宁省以豆角、黄瓜等蔬菜为主要生产品种,而河北省则以西红柿、白菜、茄子
等蔬菜为主。这些蔬菜品种丰富多样,品质优良,口感好,深受广大消费者的
喜爱。
蔬菜产业是中国农业的重要组成部分,也是国民经济中的重要支柱产业之
一。蔬菜产业的发展对当地经济的发展和人民生活水平的提高有着积极的影响。
因此,加强蔬菜产业的发展,提高蔬菜品质和产量,将有利于推动中国农业和
16
湖南商务职业技术学院毕业设计
经济的可持续发展。
总之,通过对蔬菜产地信息的统计和分析,可以发现,北京蔬菜生产的主
要地区是冀、鲁、辽、云等省份,其蔬菜品种丰富多样,品质优良,口感好,
蔬菜产业也为当地经济发展做出了重要贡献。
5.3.2蔬菜规格统计
图5-9代码展示页面
图5-10数据展示页面
从蔬菜规格展示图5-10展示图中可以看出,以袋/箱装的规格最为常见,
17
湖南商务职业技术学院毕业设计
占据了所有规格中的近一半,达到了42%。而单独使用箱子装的规格数量很少,
仅占总规格的不到1%。另外,也有不少蔬菜使用机器进行剥皮加工,这一规格
占比约为10%。此外,还有一些蔬菜规格含有“泥”等字眼,这一类规格占比较
大,约为11%。
蔬菜规格展示图的含义在于,通过展示各种蔬菜规格的分布情况,可以更
好地了解农业生产中的规格分布情况以及各种规格的应用范围和市场需求。在
实际生产中,蔬菜规格的大小和形状等因素会直接影响到产品的外观、品质和
适用范围等方面。因此,对于农业生产者和销售商而言,了解蔬菜规格的分布
情况是十分重要的,可以有针对性地进行生产和销售策略的制定,以满足市场
需求,提高产品质量和竞争力。
5.3.3红尖椒与线椒的最高价、最低价、平均价随日期的变化趋势统计分
析
18
湖南商务职业技术学院毕业设计
图5-11代码展示页面
图5-12数据展示页面
首先,从5-12图表中可以看出,红尖椒的价格波动幅度小于线椒。线椒的
最高价和最低价之间的差距更大,而红尖椒的价格则相对稳定。
同时,红尖椒和线椒的平均价也有所不同,线椒的平均价整体高于红尖椒,
这也反映了线椒相对稀缺,而红尖椒的供应充足的市场供求情况。
其次,从时间维度上来看,红尖椒和线椒的价格变化趋势存在一定的相似
性。两者的价格变化趋势基本呈现出一致的形态,都在近期内经历了一次小幅
波动后逐渐趋于平稳,整体表现出市场供求关系趋于平衡的状态。这也反映了
该地区蔬菜市场较为稳定,消费者对红尖椒和线椒的需求也相对平稳。
最后,从红尖椒和线椒的价格对比来看,线椒的价格波动幅度更大,这也
可能与线椒在该地区的供应量相对较少,
市场需求较大,供求矛盾较为突出有关。然而,由于市场竞争较为激烈,
红尖椒的价格也受到其他因素的影响,价格波动也较为明显。
19
湖南商务职业技术学院毕业设计
5.3.4对蔬菜产地以及品名进行统计
图5-13数据展示页面
图5-14数据展示页面
上面的代码通过seaborn库中的countplot函数对蔬菜的产地以及品名做
了计数图。这个图展示了前20个蔬菜产地和品名的计数分布情况,其中不同颜
色的条柱代表不同的品名。
20
湖南商务职业技术学院毕业设计
从图中可以看出,河北、云南等地区是蔬菜生产的重要产地,其品种也较
为丰富,其中以河北和云南产地的蔬菜种类最多。此外,图中还可以看出大多
数蔬菜生产地
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度专业牧场代牧服务标准合同4篇
- 2025年度临时停车场帐篷搭建施工合同范本3篇
- 2024物流包装与装卸合同
- 2025年度智慧家居产品研发承包经营合同书范文4篇
- 2025年度桉树种植与生物质能利用技术研发合同3篇
- 2025年个人汽车抵押贷款抵押权设立及转让合同4篇
- 2025年度住宅小区地下车库车位使用权购买合同范本4篇
- 2025年度文化产业园开发承包合同股东内部合作协议4篇
- 2024年甲乙双方石材供需合同
- 2025年度新能源项目地质钻孔工程承包协议4篇
- 【传媒大学】2024年新营销
- 乳腺癌的综合治疗及进展
- 【大学课件】基于BGP协议的IP黑名单分发系统
- 2025届广东省佛山市高三上学期普通高中教学质量检测(一模)英语试卷(无答案)
- 自身免疫性脑炎课件
- 人力资源管理各岗位工作职责
- 信阳农林学院《新媒体传播学》2023-2024学年第一学期期末试卷
- 2024建筑公司年终工作总结(32篇)
- 信息安全意识培训课件
- 2024年项目投资计划书(三篇)
- 配电安规课件
评论
0/150
提交评论