




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
租房爬虫爬虫技术关键代码数据分析运行结果01.02.03.04.
目录01爬虫技术01爬虫技术123request.get(url,params=None,**kwargs)其中,url为获取页面的链接,params为额外参数,字典或者字节流格式,其为可选。**kwargs为12个控制访问的参数。BeautifulSoup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。pyecharts是一款将python与echarts结合的强大的数据可视化工具。请求库:requests
HTML解析:BeautifulSoup数据可视化:pyecharts爬虫技术01导入相关包importreimportrequestsimportrandomimporttimefrombs4importBeautifulSoupfrompyecharts.chartsimportBar,Line,Page,Piefrompyechartsimportoptionsasopts爬虫技术01请求头user_agent_list=["Mozilla/5.0(WindowsNT6.1;WOW64)AppleWebKit/537.1(KHTML,likeGecko)Chrome/22.0.1207.1Safari/537.1","Mozilla/5.0(WindowsNT6.1;WOW64)AppleWebKit/536.6(KHTML,likeGecko)Chrome/20.0.1092.0Safari/536.6","Mozilla/5.0(WindowsNT6.2;WOW64)AppleWebKit/537.1(KHTML,likeGecko)Chrome/Safari/537.1",]UA=random.choice(user_agent_list)headers={'User-Agent':UA}爬虫技术01目标网址url='/zufang/pg'02关键代码02关键代码#目标网址url='/zufang/pg'#要获取的信息title_list=[]#标题price_list=[]#租金position_list=[]#地理位置size_list=[]#房子面积02关键代码#标题title=li_quick.find('a',class_='twoline').get_text().strip()#租金price=li_quick.find('span',class_='content__list--item-price').find('em').get_text().strip()#位置信息position=li_quick.find('p',class_='content__list--item--des').find('a').get_text().strip()#面积size=re.findall(r'\d+㎡',temp_size)02关键代码<aclass="twoline"target="_blank"href="/zufang/XZ2795760721969807360.html">整租·绿地国际花都1室1厅南</a>爬虫技术01数据存储df=pd.DataFrame({'标题':title_list,'租金':price_list,'位置':position_list,'面积':size_list})df.to_excel("zufang.xlsx",index=False)数据分析0303数据分析defarea_house_num()->Bar:c=(Bar(init_opts=opts.InitOpts(width="600px",height="300px")).add_xaxis(list(area_num_dict.keys())).add_yaxis("数量",list(area_num_dict.values())).set_global_opts(title_opts=opts.TitleOpts(title="房源数量",subtitle="各地区房源数量"),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=30))))returnc各区房源数量柱状图03数据分析defarea_house_average_price()->Line:c=(Line(init_opts=opts.InitOpts(width="600px",height="300px")).add_xaxis(list(average_price_dict.keys())).add_yaxis("平均价",list(average_price_dict.values())).set_global_opts(title_opts=opts.TitleOpts(title="房源平均价",subtitle="各地区房源平均价"),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=30))))returnc各区租房均价折线图03数据分析defarea_house_type_num()->Bar:c=(Bar(init_opts=opts.InitOpts(width="600px",height="300px")).add_xaxis(list(area_room_type_dict.keys())).add_yaxis("数量",list(area_room_type_dict.values())).reversal_axis().set_series_opts(label_opts=opts.LabelOpts(position="right")).set_global_opts(title_opts=opts.TitleOpts(title="房源户型数量",subtitle="各地区房源户型数量"),))returnc各区域房源数量柱状图03数据分析defarea_room_size()->Pie:c=(Pie(init_opts=opts.InitOpts(width="600px",height="335px")).add("",[list(z)forzinzip(area_room_size_dict.keys(),area_room_size_dict.values())]).set_global_opts(title_opts=o
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025建筑安全员-C证考试(专职安全员)题库及答案
- 2025年-湖北建筑安全员-C证考试(专职安全员)题库附答案
- 制氧公司转让合同样本
- 刊物订购合同样本
- 企业联运合同标准文本
- 制作钢筋劳务合同样本
- 出售化工工厂合同样本
- 乡镇劳动合同样本
- 出售玩具合同标准文本
- 2025云南建筑安全员考试题库附答案
- GB/T 5267.1-2002紧固件电镀层
- GB/T 4857.22-1998包装运输包装件单元货物稳定性试验方法
- 2023年江苏信息职业技术学院高职单招(数学)试题库含答案解析
- 量化投资-统计套利
- GB/T 25074-2010太阳能级多晶硅
- GB/T 11047-2008纺织品织物勾丝性能评定钉锤法
- GB 18245-2000烟草加工系统粉尘防爆安全规程
- 特种陶瓷介绍课件
- 海水淡化简介课件
- 有机物污染(环境化学)课件
- 安全生产培训合格证书样本
评论
0/150
提交评论