基于Python的瓜子二手车网数据采集与分析_第1页
基于Python的瓜子二手车网数据采集与分析_第2页
基于Python的瓜子二手车网数据采集与分析_第3页
基于Python的瓜子二手车网数据采集与分析_第4页
基于Python的瓜子二手车网数据采集与分析_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

湖南商务职业技术学院毕业设计

目录

1引言............................................................................................................................1

1.1项目背景......................................................................................................1

1.2开发环境与工具..........................................................................................2

1.2.1Python简介..........................................................................................2

1.2.2MySQL简介............................................................................................2

1.2.3Jypyternotebook简介......................................................................2

2需求分析.....................................................................................错误!未定义书签。

2.1可行性需求分析..........................................................................................3

2.2采集目标功能分析......................................................................................3

2.3关键技术分析..............................................................................................3

2.3.1网络爬虫技术.......................................................................................3

2.3.2文件存取技术.......................................................................................3

2.3.3可视化技术...........................................................................................3

3数据采集....................................................................................................................3

3.1采集页面分析..............................................................................................6

3.2字段分析......................................................................................................8

3.3编程实现......................................................................................................9

4数据清洗与处理......................................................................................................13

4.1数据清洗....................................................................................................13

4.2数据储存....................................................................................................14

4.3编程实现....................................................................................................15

5数据统计与分析......................................................................................................16

5.1数据准备....................................................................................................16

5.2数据展示....................................................................................................18

5.2.1依据车辆品牌进行统计.....................................................................18

5.2.2依据车辆公里数进行统计.................................................................19

5.2.3据车辆排期以及进气方式进行统计和分析.....................................19

I

湖南商务职业技术学院毕业设计

5.2.4依据车辆颜色进行统计.....................................................................20

5.3综述............................................................................................................21

6小结..........................................................................................................................21

参考资料.........................................................................................................................22

II

湖南商务职业技术学院毕业设计

基于Python的瓜子二手车网数据采集与分析

1引言

时光荏苒,1980年开始一直到2000年,我国的汽车发展呈现的是跨越式的,

我国的汽车产量已经达到了一百万台,在2000年突破了两百万台,并且我国的

民用乘车量从八零年的五千四百台发展到了零零年的六十一万台,由这些数字

的佐证,很难不看出这是一段我国汽车时代的跨越式发展,就像人们常常说的,

历史是无法抵挡的,有波折,有倒退,但从历史性的角度来看,我国的汽车发

展是在大步向前的。

近二十年我国的汽车发展更是来到了一个巅峰,不仅在以前我国的汽车只

能依靠进口,但在2000年之后我们国家开始有了合资品牌,顾名思义合资车就

是外国品牌给我们国家的汽车厂家提供技术而由我国的汽车厂家制造车辆,甚

至我国还诞生出了自己国家的汽车品牌,比如比亚迪,红旗,吉利等等响当当

的汽车品牌。

根据公安部来布最新的据,截至2022年11月,我们全国的机动车保有量

为四点一五亿台,其中汽车的保有量达到了惊人的三点一八亿台,从这些数据

中我们便可以看出我们国家的二手车市场也是非常之巨大的。特别是到现在我

们都是比较喜新厌旧的,所以很多人都会把自己的车辆变卖来换成其他的车,

这也就诞生了二手车市场。

1.1项目背景

二手车市场是一个庞大而且不断增长的市场,在这个市场中,人们可以以

比新车更便宜的价格购买汽车,并在之后将它们再次转手卖掉。因此,二手车

交易也是一个非常大的市场,为人们提供了一种更便宜、更实用的购车方式。

然而,二手车市场存在一些问题,例如质量不一、价格不透明、交易安全等。

因此,针对这些问题,许多企业开始探索使用技术手段来解决这些问题,因此

我们可以使用大数据信息技术对车辆进行一个全面的分析。

大数据技术可以通过分析和处理海量的数据,在二手车买卖过程中提供更

好的解决方案,例如帮助消费者评估汽车的质量、为汽车定价、提供更安全和

可靠的交易平台等。因此,二手车交易的大数据分析解决方案正逐渐成为一个

备受关注的领域。

但是,与新车市场相比,二手车市场存在一些问题。例如,二手车的质量

1

湖南商务职业技术学院毕业设计

和状态存在着较大的不确定性,消费者难以准确评估其实际价值;价格和交易

过程缺乏透明度,买家可能会陷入价格陷阱或遭受欺诈。针对这些问题,一些

企业开始探索运用大数据技术,通过分析海量数据和应用智能算法,为消费者

提供更准确、透明和安全的二手车购车体验。

1.2开发环境与工具

1.2.1Python简介

Python是一种高层次、解释型的动态编程语言,被广泛用于机器学习、人

工智能、数据处理、Web开发、科学计算、网络爬虫等领域。它的哲学是代码可

读性和简洁性,语法简单明了,易于学习和使用。

Python的主要特点有:

简单易学:Python语法简单明了,支持面向对象编程、函数式编程和过程

编程。

跨平台:Python可以在类Unix、Linux、Windows等几乎所有操作系统上运

行,具有很强的可移植性。

Python有丰富的第三方库和工具,包括NumPy、SciPy、Pandas、Matplotlib

等用于数据分析和科学计算的库,Django、Flask等用于Web开发的框架,以及

机器学习和深度学习的库如TensorFlow、PyTorch等。

扩展性强:Python可以使用C、C++等编写扩展模块,也可以被其他语言作

为扩展模块调用。

开源免费:Python是开源的,免费使用,且有活跃的开发社区支持。

Python的应用广泛,包括数据分析、人工智能、Web开发、游戏开发等领

域。其简单易学和可扩展性强的特点使其成为了许多程序员的首选编程语言。

1.2.2MySQL简介

MySQL是一个流行的关系型数据库管理系统,由瑞典MySQLAB公司开发,

并由Oracle公司维护和支持。MySQL被广泛用于Web应用程序和其他类型的软

件,以处理各种任务,从简单的Web页面到复杂的Web应用程序,甚至是企业

级数据处理应用。

MySQL的主要特点包括:

开源免费:MySQL是开源软件,允许任何人免费使用;同时也有一个商用版

2

湖南商务职业技术学院毕业设计

本提供额外的功能和支持。

轻量级:MySQL是非常轻量级的,能够在多种操作系统和硬件平台上运行。

高扩展性:MySQL支持大型数据库,能够处理数百万到数十亿行的数据,并

支持分布式处理。

安全性:MySQL具有强大的安全功能,包括支持SSL加密,权限管理等,保

障数据安全。

性能强劲:MySQL在处理大量数据和高并发请求方面有很好的表现,能够快

速响应大量的读写数据请求。

MySQL的应用场景非常广泛,包括Web应用程序、软件开发、大数据处理等

领域。借助MySQL的高扩展性和高性能,用户可以存储和处理大量数据,并轻

松地在互联网上实现数据共享。

1.2.3Jypyternotebook简介

Jupyternotebook从本质上来说是一种应用程序,是一种基于浏览器的

工具。它将一些解释性文本、数学、计算等结合起来,放在一个交互式的创作型

文档中。并且在这个创作型文档中所有的内容都是可分享并可见的。在一些教

学或者项目的讲解中,jupyternotebook或许是一枝独秀。因为它支持Markdown

标记语言,在浏览器界面编辑代码的同时可以很方便的为代码提供注释。在

jypyternotebook执行代码的同时对于注释性文本并不会执行,这个极大的方便

了教学人员,或者开发人员讲解项目

Jupyternotebook在大数据方面应用比较广泛,特别适合用来做数据的

清洗和处理,在数据挖掘和可视化上的应用也是十分方便的。对于比较高层次的

开发人员来说,这个工具也可以用来做深度的机器学习。

对于初学者来说安装Jupyternotebook的方法就是安装Anaconda,因为

Anaconda的版本中就是自带Jupyternotebook。如果觉得不需要Anaconda,可

以自主选择进入官网下载安装包。

2需求分析

2.1可行性需求分析

1、技术可行性

Python是面向对象语言中的一门通俗易懂的计算机编程语言,本次项目中

使用Python编写程序来实现数据获取,数据清洗预处理,数据可视化。在数据获

3

湖南商务职业技术学院毕业设计

取的过程中遇到一些小问题。随后通过抓包分析发现瓜子二手车网站的页面的

数据是动态传输的,所以我们通过浏览器控制台获取请求和其参数。然后就可以

得到网页面数据的返回值。随后将爬取出来的原始数据暂时以csv格式储存起

来,在后续的数据预处理和可视化中再进行调用。最后我们会将准确的数据存入

MySQL数据库中做持久化储存。

以上为此次项目的技术可行性,我也将在后续的工作中将所有的步骤实现

到位,保证数据的准确性和安全性。

2、项目可行性

本次项目通过采集的是我们国家比较知名的二手车交易平台瓜子二手车交

易平台,来分析我国的二手车市场行情,我们也将会从车辆品牌,车辆排量,

车辆颜色,车辆年份对他进行深度的解析,分析出相对有价值的信息,最后用

可视化对结果进行解析得出结论二手车交易平台,而建立一个完善的二手车交

易平台,不仅可以有效避免交易中的欺诈风险,而且还可以提供保险、退货等

一系列服务,为我们的二手车的买家和卖家提供更安全、放心、便利的交易环

境。

2.2采集目标功能分析

本次项目的数据集的来源是瓜子二手车交易网站,是通过python爬取瓜子

二手车交易网站在湖南所有信息。数据清洗后共4333条记录,爬取完成后会去

尽可能的检查数据的准确性,真实性,可行性,确定爬取出来的数据无误并且是

属于瓜子二手车交易网站实时存在的二手车信息。

分析瓜子二手车交易网站信息,明确我们需要爬取的二手车有车辆品牌、车

型、车辆排量、车辆颜色、车辆年份、生产批准日期等数据,在对原始的数据进

行一个预处理后我们会对其数据进行一个多个维度的分析。例如,从车辆的排量

对其进行一个分析,查看有多少款车辆排量是2.0排量,又有多少车辆的排量是

1.6排量。又或者想要得到二手车车辆的车辆颜色,那么我们就可以根据车辆的

颜色去统计说明什么颜色的车辆是最多的,查看什么颜色是人们普遍喜欢的颜

色并且更加容易卖出。

2.3关键技术分析

2.3.1网络爬虫技术

在我们日常生活中浏览网页通常都会遇到需要缓存在本地的数据,当数量

4

湖南商务职业技术学院毕业设计

量比较小的时候我们可以自己采取手动下载的方式去获得想要的数据,不过在

我们的大数据领域一般用到的数据体量都是几个G甚至几个T的单位,这个时

候采取手动下载获取数据无疑是一个很愚蠢的方式,所以我们会采取网络爬虫

的手段自动化的获取数据。

网络爬虫也被人们叫做网络机器人,顾名思义就是让人们不用自己动手操

作,只需要编写程序或者一些小脚本用来自动的浏览庞大的互联网,并且对想要

的目标网页去进行精准的数据的采集。当下常见的一些网络爬虫按照实现的原

理和技术结构一般可以分为:通用网络爬虫、聚焦网络爬虫、增量式网络爬虫、

深层网络爬虫等一些类型。

在大家的印象中常常将普通的网络爬虫与黑客混为一谈,其实二者之间有

很大的区别。黑客属于违反法律肆意窃取个人或者组织内有价值的信息以此获

利,而爬虫仅仅知识用来代替重复无意义的动作,在合法合理的范围内去获得自

己想要的信息,在一定程度上网络爬虫和普通用户浏览网页是没有本质区别的,

但是爬虫确实可以作为一种攻击的手段。在编写网络爬虫的脚本时没有设置一

定的睡眠缓冲时间,通过极高的频率反复访问客户端网站会让服务器持续在高

强度环境下工作,对服务器造成一定的压力,如果一时间处理不过来服务器往往

会自动关机,也就是宕机,这也是常见的DDOS攻击。

由此可见,网络爬虫技术在应用场景的不同它发挥的作用也是不同的。在好

的场景下可以帮我们完成抢购、投票、报名、抢购等操作。但是在坏的场景下

同样也能一直发送骚扰信息,给他人带来困扰。爬虫技术是一把双刃剑,一个不

小心可能就会伤害到自己和他人,所以我们技术人员要懂法、守法。在法律允许

的范畴内去编写自己的脚本程序,不要一不小心半只脚踏进犯罪的深渊。

有爬虫技术,那也一定存在反爬取的技术了。高级的爬虫都会涉及到反爬虫

的概念,往往能够绕过或者突破人家的防守机制从而获取到自己想到要的数据

时,就代表爬虫工程师的个人水平已经很不错了。常见的反爬机制有IP、JS加

密、css反爬、或者Ajax异步、验证码等等手段。这些手段会加大爬虫工程师

的工作量,也会加大网站的开发成本。所以像一般的小网站最多设置一个小反爬,

对于我们获取数据而言也相对容易。我们也不用去考虑成本的问题。

2.3.2文件存取技术

Python内置csv模块如图2-1显示:

5

湖南商务职业技术学院毕业设计

图2-1python内置csv模块

2.3.3可视化技术

爬取下来的数据通过预处理、保存为csv文件格式。该数据集我们能否一

眼就得到我们想要的结论呢?答案是否定的!

我们需要一种技术,根据我们获取到的庞大数据将其通过统计学图形的方

式展现在我们眼前,让我们对其结果一目了然。这个就是数据可视化技术。

显然我们获取到的数据是一串串冗长的字符串,上面写的一条条信息或许

我们能够看懂读懂,但是当它成千上万的时候我们短时间内很难看出端倪和破

绽,我们需要进行深入的了解和分析。对这一坨枯燥而乏味的数据集进行处理完

毕后,我们就要导入需要的第三方库将数据合理的进行判断,决定使用什么样的

几何图形才能最好、并且直观的表达出数据集的信息。

多年来可视化的技术也逐渐发展成为了一下三类:科学可视化、信息可视

化、可视化分析。而我们这里用到的就是信息可视化,信息可视化的处理对象是

非结构化、非几何的抽象数据,如金融交易、社交网络和文本数据,其核心挑战

是针对大尺度高维复杂数据如何减少视觉混淆对信息的干扰。

本次项目中仅仅只是将得到的数据用很简单的可视化手段实现数据可视化,

具体的就是用python第三方库matpoltlab去进行可视化,matplotlab中包含

了许多库,分别对应饼图、条形图、直方图、折线图等图形,可以很好的将数据

高效率的表现出来,可视化图形呈现出来后对于结果自然一目了然,然后得出结

论。

3数据采集

3.1采集页面分析

我们首先通过谷歌浏览器搜索瓜子二手车的官方网页,然后找到湖南二手

6

湖南商务职业技术学院毕业设计

车目录集页面观察图3-1,其中URL为:

/car-source/carDetail/detail然后点击页面下方的

分页按钮,同时观察URL,发现URL没有变化。

图3-1数据网址页面

按F12调出开发者工具,刷新页面,如图3-2。

图3-2开发者工具

利用全局搜索工具定位所需数据位置,点击开发者工具上面的Headers字

段,分析这是个什么请求,发现这个是一个GET请求,如图3-3。

7

湖南商务职业技术学院毕业设计

图3-3FormData

3.2数据字段分析

我们先来到网页面打开网页的选择栏,然后将选择栏目定位到车辆要爬取

的位置也就是定位到我们所需要的数据所在的位置,然后跳出开发者工具页面

刷新一下页面再进入,点击开发者工具界面上方的数据预览Preview按钮,如图

3-4,可以看到我们需要的所有的数据信息都是呈现json格式传递在这个网页

面,我们还得知他是post方法响应的网站,所以我们可以根据以上特点通过

Requests方法中的post方法来获得响应的数据,最原始的数据格式是呈现

json格式的所以我们需要重复获取响应数据然后依次写入到csv格式的文件当

中。json数据中包括车辆品牌型号、年份、公里数、排量、颜色等数据字段。

图3-4分析数据类型页面

8

湖南商务职业技术学院毕业设计

3.3编程实现

如图3-5导入所需库

图3-5导入所需库页面

如图3-6,3-7设置请求头,伪装成浏览器访问服务器。

图3-6请求头内容页面

图3-7请求头内容页面

代码实现如下:

importcsv

importrandom

importtime

importrequests

importexecjs

9

湖南商务职业技术学院毕业设计

defget_data(clueId):

cookies={

'uuid':'76f047df-50f5-4133-bc3b-35f9a3a59868',

'sessionid':'00872dac-1c74-44a8-8466-edafb5482c39',

'guazitrackersessioncadata':'%7B%22ca_kw%22%3A%22-%22%7D',

'cainfo':

'%7B%22ca_s%22%3A%22seo_baidu%22%2C%22ca_n%22%3A%22default%22%2C%22ca_

medium%22%3A%22-%22%2C%22ca_term%22%3A%22-%22%2C%22ca_content%22%3A%

22-%22%2C%22ca_campaign%22%3A%22-%22%2C%22ca_kw%22%3A%22-%22%2C%22ca

_i%22%3A%22-%22%2C%22scode%22%3A%22-%22%2C%22guid%22%3A%2276f047df-50f

5-4133-bc3b-35f9a3a59868%22%7D',

'user_city_id':'-1',

'cityDomain':'www',

'puuid':'40dfba84-b135-4ead-fce0-6a65b97e9232',

'dsnDataObj':'%7B%7D',

'browsingHistoryCount':'1',

}

ttt=str(round(time.time()*1000))

stringifyParams=

f'ca_n=default&ca_s=seo_baidu&clueId={clueId}&deviceId=76f047df-50f5-4133-bc3b-35f9a3a

59868&fromCrm=1&guazi_city=-1&guid=76f047df-50f5-4133-bc3b-35f9a3a59868&orgUserId=

&osv=ios&platfromSource=wap&sourceFrom=wap&unit=&userId=&versionId='

token=pile(open('瓜子二手车.js','r',encoding='utf-8').read()).call('get_token',

stringifyParams,ttt)

#print(token)

headers={

'authority':'',

'accept':'application/json,text/plain,*/*',

'accept-language':'zh-CN,zh;q=0.9',

'cache-control':'no-cache',

'client-time':ttt,

#'cookie':'uuid=76f047df-50f5-4133-bc3b-35f9a3a59868;

sessionid=00872dac-1c74-44a8-8466-edafb5482c39;

guazitrackersessioncadata=%7B%22ca_kw%22%3A%22-%22%7D;

cainfo=%7B%22ca_s%22%3A%22seo_baidu%22%2C%22ca_n%22%3A%22default%22%2C%

22ca_medium%22%3A%22-%22%2C%22ca_term%22%3A%22-%22%2C%22ca_content%22%

3A%22-%22%2C%22ca_campaign%22%3A%22-%22%2C%22ca_kw%22%3A%22-%22%2C%

22ca_i%22%3A%22-%22%2C%22scode%22%3A%22-%22%2C%22guid%22%3A%2276f047d

f-50f5-4133-bc3b-35f9a3a59868%22%7D;user_city_id=-1;cityDomain=www;

puuid=40dfba84-b135-4ead-fce0-6a65b97e9232;dsnDataObj=%7B%7D;

browsingHistoryCount=1',

'origin':'',

10

湖南商务职业技术学院毕业设计

'pragma':'no-cache',

'referer':'/',

'sec-ch-ua':'"Chromium";v="110","NotA(Brand";v="24","GoogleChrome";v="110"',

'sec-ch-ua-mobile':'?0',

'sec-ch-ua-platform':'"Windows"',

'sec-fetch-dest':'empty',

'sec-fetch-mode':'cors',

'sec-fetch-site':'same-site',

'token':'',

'user-agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36

(KHTML,likeGecko)Chrome/Safari/537.36',

'verify-token':token,

}

params={

'versionId':'',

'sourceFrom':'wap',

'deviceId':'76f047df-50f5-4133-bc3b-35f9a3a59868',

'guid':'76f047df-50f5-4133-bc3b-35f9a3a59868',

'userId':'',

'orgUserId':'',

'unit':'',

'clueId':clueId,

'guazi_city':'-1',

'ca_s':'seo_baidu',

'ca_n':'default',

'osv':'ios',

'fromCrm':'1',

'platfromSource':'wap',

}

response=requests.get(url='/car-source/carDetail/detail',

params=params,cookies=cookies,

headers=headers)

#print(response.json())

#print(clueId)

returnresponse.json()['data']

defdata_parse(json_data):

ifjson_data['carCommodityInfo']['carRecordInfo']['summary'][4]['value']=='自动':

return0

11

湖南商务职业技术学院毕业设计

item={}

item['品牌名称']=json_data['carCommodityInfo']['basicInfo']['titleDesc']

item['公里数']=json_data['carCommodityInfo']['carRecordInfo']['summary'][1]['value']

item['价格']=json_data['carCommodityInfo']['carPriceInfo']['showPrice']

item['排量']=json_data['carCommodityInfo']['carRecordInfo']['summary'][4]['value']

item['车身颜色']=json_data['carCommodityInfo']['carRecordInfo']['summary'][7]['value']

withopen('瓜子二手车.csv','a',encoding='utf-8',newline='')asf:

#finame=['品牌名称','公里数','价格','排量','车身颜色']

csv_writer=csv.writer(f)

csv_writer.writerow(item.values())

print(item)

defdata_clean(file1,file2):

withopen(f'{file2}.csv','a',encoding='utf-8',newline='')asf1:

csv_writer=csv.writer(f1)

withopen(f'{file1}.csv','r',encoding='utf-8')asf2:

#finame=['品牌名称','公里数','价格','排量','车身颜色']

#csv_reader=csv.reader(f)

data=f2.read()

#print(data.split('\n')[1:-1])

count=0

foriindata.split('\n')[1:-1]:

ifi.split(',')[-2]!='自动':

print(i)

csv_writer.writerow(i.split(','))

count+=1

print(count)

defmain(file):

withopen(f'{file}.txt','r',encoding='utf-8')asf:

s=f.read()

clueIds=s.split('\n')[:-1]

#print(clueIds)

forclueIdinclueIds[600:]:

print(clueId)

json_data=get_data(clueId)

data_parse(json_data)

time.sleep(random.randint(15,20)/10)

12

湖南商务职业技术学院毕业设计

if__name__=='__main__':

main(file='clue_ids')

#data_clean(file1='瓜子二手车1',file2='瓜子二手车(清洗)')

4数据清洗与处理

获得庞大的数据集之后我们需要对数据进行预处理,也就是所谓的清洗和

检查,确定爬取过来的数据是否存在无效值和确实值,要保证数据的一致性,这

个对于信息质量的评估是一项很重要的任务。不仅如此,我们需要将数据进行有

理化和有序化,这样子能够在数据调用共享过程中方便很多开发人员对数据信

息的使用。

本次项目中我们需要将爬下来的数据和网页原数据进行比对,并且检查是

否出现空值、错值,还有数据的位置是否正确。根据不同的需求我们要对数据进

行不同的处理。

4.1数据清洗

打开爬取到的数据文件,如下图:

图4-1查看表格数据的描述

我们在图4-1中查看表格数据的表述,同时我们用isnull函数来查询数据

是否缺失中经过比对和检查数据,如图4-2,确定爬取过来的数据没有存在无效

值和确实值,要在我爬取的数据里面并没有发现我所需的数据发现缺失,也没有

多余的数据。

13

湖南商务职业技术学院毕业设计

图4-2查看表格是否有数据丢失

4.2数据储存

数据储存得方法有很多种,常见得可以直接用记事本格式储存(txt),或者

直接用其他文件的形式储存csv、excel、json等,但是以上方法保存的数据体

量普遍都比较小。如果需要储存较大的数据信息就需要用到我们的数据库,数据

库也分为关系型和非关系型数据库。关系型数据库比较典型的有MySQL和

Oracle等,非关系型数据库等以键值对形式储存数据的代表有Mongodb、Redis

等。本次项目我们用到的是csv。

如图4-3所示:

图4-3数据存储为csv页面

14

湖南商务职业技术学院毕业设计

4.3编程实现

如图4-4,4-5,4-6。

图4-4编程代码(一)

图4-5编程代码(二)

15

湖南商务职业技术学院毕业设计

图4-6编程代码(三)

图4-7编程代码(四)

5数据统计与分析

5.1数据准备

导入相关库,如图4-1、5-2。

16

湖南商务职业技术学院毕业设计

图5-1数据准备页面

图5-2数据加载页面

17

湖南商务职业技术学院毕业设计

5.2数据展示

5.2.1依据车辆品牌型号年限进行统计

图5-3数据展示页面

我们把表格中的所有车辆品牌年限的字段数据进行一个汇总以及一个处理,

随后将他出现的频率次数进行统计,最后生成一个特定的序列,在序列里面的

数据按照词频生成我们想要的词云图,如图5-3中不难看出来年限里面2016款

和2018款是出现的最多的,其次便是2017款,可以看出在二手车市场里面五

至七年的年限的车是二手车里面的头牌,新车开到五至七年这个区间内卖出的

概率是最高的,当然也说明了我们大部分人去考虑买二手车能接受的年限也就

是五至七年。

不仅如此,在词云图中我还发现了我们国家的进口车辆与合资车是占据很

大部分的,国产车还得要更加的努力,争取再过几年的二手车市场能在词云图

上看到国产车。不难看出在词云图中的大部分品牌都属于德国车或者日系车,

这也说明了这两个地区的车辆也是属于我国人群购买的主力。

18

湖南商务职业技术学院毕业设计

5.2.2依据车辆公里数进行统计

图5-4数据展示页面

从图5-4中可以看出在十万公里以内的车辆是二手车市场里面最多的,大

部分人都会在十万公里内去将自己的车辆进行交易,而大于了十万公里数的车

辆相对来说比较少,这也充分的说明了车辆在十万公里内时进行交易是最容易

出售的而根据有关网站对数据的统计中,绝大部分人对车辆的使用大概是一年

开一万公里左右,从图中我们可以看出5到7万公里数的车是最多的,这也变

相证明了图5-5的数据可靠性

5.2.3据车辆排量以及进气方式进行统计和分析

图5-5数据展示页面

从图5-5中我们可以很直观的看出2.0T二手车是在所有排量中一骑绝尘

19

湖南商务职业技术学院毕业设计

的,这个排量在所有的车里面是一个黄金排量,能够适用于大部分中国的大部

分地形。

要知道我国对于车辆是有排量税的,所以在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论