系统聚类在招聘网站分类评价的应用_第1页
系统聚类在招聘网站分类评价的应用_第2页
系统聚类在招聘网站分类评价的应用_第3页
系统聚类在招聘网站分类评价的应用_第4页
系统聚类在招聘网站分类评价的应用_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多元统计分析作业基于系统聚类的招聘网站分类评价研究授课教师 学 院 专 业 学 号 学生姓名 二 一六 年 五 月系统聚类在招聘网站分类评价研究中的应用摘要:随着互联网技术的发展,各种各样的网站呈雨后春笋般涌现。互联网的出现,也使人力资源市场发生了翻天覆地的变化。利用国际互联网开发和建立网上人力资源市场,这在发达国家是很常见的事,也是企业和人才之间建立联系的重要途径。在我国,网络招聘也凭其低成本、快速反应、突破区域限制的特点受到了企业和人才的越累越多的关注。本文应用聚类分析方法对30个招聘网站样本进行了评价, 对招聘网站的发展具有现实意义。关键词:招聘网站;系统聚类;评价一、引言就业始终是关乎

2、社会稳定的问题。利用国际互联网开发和建立网上资源市场,在发达国家已经是司空见惯的事情,也是企业寻找人才的重要途径。在我国,网络招聘也在悄然兴起。越来越多的人都开始通过网络来申请职位,同样,越来越多的公司摒弃了传统的招聘方式,把职位招聘信息放在了网上。招聘类网站评价能够作为比较网站优劣、指导招聘网站建设的依据和手段。对于特定招聘类网站,可以根据评价,完善自身网站的不足,改进缺点,寻找自身网站的发展之路。就整个招聘类网站整体而言,进行科学有效地招聘类网站评价有利于推动整个招聘类网站的整体发展水平和提高服务质量。国家现有招聘类网站建设水平参差不齐,本文采用部分数据对招聘类网站进行评价,以期提高网站运

3、作水平,更好地方便了网上求职和招聘。二、实证分析为了更好地研究招聘网站的发展现状,并达到网站分类评价研究的目的,本文选取了30家招聘网站作为研究样本。这30家招聘网站种类各异。本文采用这100家示范企业的数据,对电子商务网站的发展状况进行了分类与评价。对于评价网站的指标变量方面,综合考虑对招聘网站有影响力的各因素,本文选取了八个指标变量作为评价招聘网站的标准:每百万人中访问该站的人数(Access Per Million Users)、人均页面浏览量(Page Views Per User)、反向链接数(Site Linking In)、访问速度(Speed)、日均PV量(Average PV

4、 Visit)、日均IP量(Average IP Visit)、Google收录数量(Google Index)、平均响应时间(Average Response Time) 。在本文所收集数据中,每百万人中访问该站的人数、人均页面浏览量、反向链接数、访问速度、日均PV量、日均IP量、Google收录数量、平均响应时间这个八个指标数据来自于Alex 网站和站长之家网站。具体如表1所示。表1招聘网站的数据编号网站名称日均PV日均IP人均页面浏览量每百万人中访问人数反向链接数访问速度平均响应时间谷歌收录数量1前程无忧7,095,549365,75019.47704,2159202439,0

5、70,0002智联招聘6,249,100437,00014.39204,243891401,700,0003中华英才网389,88072,2005.41522,793575439,660,0004猎聘网1,771,085171,95010.33621,62067442234,0005大街校园招聘360,24045,6007.99679767650732,0006赶集网招聘906,77539,42523.0837,593808412,510,000758同城招聘8,850,200646,00013.71,3608,3791,0474316,900,0008卓博人才网148,77013,77510

6、.8296832,17218911,0009智通人才网10,9723,3253.378151,88111680,00010应届生求职网35,3684,8457.3102,3041,614202,770,00011过来人求职网148,77017,1008.7363061,40542325,00012应届毕业生95,00047,5002.01001,2721,80871,130,000131010兼职网8,5502,3753.6542586343524,00014中国人才热线213,18024,2258.8511,2621,14716775,00015南方人才网14,2502,3756.05623

7、2,438758255,00016528招聘网19,0003,8005.084082,48080114,00017若邻网29,49712,8252.3278121,627191,080,00018百才招聘网3,8471,2823.0330796313353,00019人人校招1,063,620342,0003.172013,6471,129461,580,00020我的工作网2,2807603.025451,7403741,250,00021HiAi大学生招聘11,9703,3253.672501,1324147,20022中国就业网4183801.112391,299253293,00023

8、汕头招聘网62,7005,70011.01221971124260,00024看准网328,70082,1754.01734401,11177675,00025数字英才网17,90713,7751.3294824,393132730,00026浙江人才网17,1004,7503.6103661,10546733,00027深圳人才网14,0601,7578.042948855326,50028湖南人才网2,9929973.0222433220168,90029河南九博人才网11,4001,9006.04212907640224,00030天津易才网2,2807603.025451,7403,8

9、4491,700采用计算Z-Score的方法对原始数据进行标准化,标准化后的数据如表2所示,表2 标准化后的数据(部分数据)编号网站名称Z日均PVZ日均IPZ人均页面浏览量Z每百万人中访问人数Z反向链接数Z访问速度Z平均响应时间Z谷歌收录数量1前程无忧2.735081.818882.365731.818880.76907-0.54261-0.018521.978442智联招聘2.359622.270801.404332.270800.77828-0.57928-0.30691-0.036473中华英才网-0.23937-0.04305-0.27340-0.043050.30125-0.9788

10、7-0.302652.139744猎聘网0.373300.589640.650290.58964-0.08466-0.85368-0.30407-0.437275大街校园招聘-0.25251-0.211770.19787-0.21177-0.35542-0.85115-0.29270-0.301126赶集网招聘-0.01009-0.250943.04436-0.250941.88040-0.68424-0.305490.18498758同城招聘3.513393.596451.291233.596452.13899-0.38201-0.302654.119128卓博人才网-0.34632-0.4

11、13630.74455-0.41363-0.392921.04058-0.33816-0.252189智通人才网-0.40744-0.47991-0.66927-0.47991-0.349500.67260-0.34811-0.3153410应届生求职网-0.39662-0.470270.08477-0.470270.140370.33497-0.335320.2560611过来人求职网-0.34632-0.392540.34868-0.39254-0.516950.07069-0.30407-0.4123912应届毕业生-0.37017-0.19972-0.91433-0.19972-0.1

12、99150.58029-0.35379-0.19231131010兼职网-0.40851-0.48594-0.61272-0.48594-0.47780-0.61469-0.30265-0.3579814中国人才热线-0.31775-0.347350.36753-0.34735-0.20244-0.25556-0.34100-0.2893615南方人才网-0.40599-0.48594-0.16030-0.48594-0.412661.376950.71312-0.4315316528招聘网-0.40388-0.47690-0.34880-0.47690-0.483401.43006-0.25

13、008-0.4700817若邻网-0.39922-0.41966-0.85778-0.41966-0.350480.35141-0.33674-0.2059818百才招聘网-0.41060-0.49287-0.72582-0.49287-0.51663-0.48823-0.34527-0.4047419人人校招0.059491.66824-0.705091.668243.87211-0.27832-0.29838-0.0692820我的工作网-0.41130-0.49618-0.72582-0.49618-0.438330.494300.16759-0.1595021HiAi大学生招聘-0.4

14、0700-0.47991-0.61272-0.47991-0.53538-0.27453-0.30549-0.4883422中国就业网-0.41212-0.49859-1.08399-0.49859-0.53900-0.06335-0.00431-0.4211423汕头招聘网-0.38449-0.464850.78225-0.46485-0.54558-0.80690-0.32964-0.4301624看准网-0.266500.02022-0.537310.02022-0.47287-0.30108-0.25434-0.3167025数字英才网-0.40436-0.41363-1.04629-

15、0.41363-0.459053.84910-0.17621-0.3016726浙江人才网-0.40472-0.47088-0.61272-0.47088-0.49721-0.308670.29971-0.4922227深圳人才网-0.40607-0.489860.21672-0.48986-0.52090-0.58687-0.28844-0.4940028湖南人才网-0.41098-0.49468-0.72582-0.49468-0.54393-1.28615-0.07818-0.4824129河南九博人才网-0.40725-0.48895-0.16030-0.48895-0.54788-0

16、.559050.54548-0.4400030天津易才网-0.41130-0.49618-0.72582-0.49618-0.438330.494305.09726-0.47617各类指标的均值、方差、标准差、偏度、峰度如表3所示。表3 各指标的描述统计量变量名N极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误日均PV304188850200929515.33411600.3272254427.8365082444866315.8872.796.4276.838.833日均IP3038064600078987.7028784.43315765

17、8.83224856307221.3212.476.4275.726.833人均页面浏览量301.123.06.850.96855.304828.1411.505.4272.207.833每百万人中访问人数3011360166.2960.599331.913110166.4232.476.4275.726.833反向链接数30212136471877.33554.9523039.5989239154.8512.706.4277.694.833访问速度3033243931349.10144.381790.808625377.1282.147.4276.629.833平均响应时间307384425

18、6.03128.514703.901495475.9644.889.42725.323.833谷歌收录数量3026500169000001833410.00667806.1663657725.01113378952253344.8263.178.42710.440.833有效的 N (列表状态)30从上表3可知,样本量为30,平均值较高的三个指标分别是网站的日均PV量、日均IP量和谷歌收录数量,从极大值和极小值方面分析,在所有指标中,极大值最大的是谷歌收录数量,极小值最小的是每百万人中访问人数。标准差较大的变量为谷歌收录数量,可见谷歌收录数量在样本期间波动幅度较大,偏度为0.427,大于0,呈

19、正偏态分布,峰度为0.833,大于0,表示分布为尖顶峰。采用欧式距离平方,瓦尔德法对样本进行系统聚类,相关结果如下。表4 聚类进度表阶群集组合系数首次出现阶群集下一阶群集 1群集 2群集 1群集 211318.01700221321.0791010391727200135912.3933086527.54900972629.71600148920.966501895231.22060131013221.55320111113242.037100161215162.5230017135113.06394191426283.7927016158104.5340017161

20、3265.390111421178156.98615121818899.12417823194511.39401321201214.20300242141318.758191622223425.763021262382534.55918026241746.510200272561959.3230027263875.5612223282716101.72724252928330128.725260292913232.00027280从表4中可以看出,第1步,样本13和18聚为一类,聚类系数是0.017,它们下次与其他样本再次聚合在第2步,第2步时,样本13、21、18聚为一类,出现群集,样本个数

21、为3,以此类推,可以解释表格。表5 聚类成员表案例10 群集9 群集8 群集7 群集6 群集5 群集4 群集3 群集2 群集1:前程无忧1111111112:智联招聘1111111113:中华英才网2222222224:猎聘网3322222225:大街校园招聘3322222226:赶集网招聘4433333117:58同城招聘5544111118:卓博人才网6655442229:智通人才网66554422210:应届生求职网66554422211:过来人求职网33222222212:应届毕业生66554422213:1010兼职网73222222214:中国人才热线33222222215:南方人

22、才网66554422216:528招聘网66554422217:若邻网66554422218:百才招聘网73222222219:人人校招87665331120:我的工作网66554422221:HiAi大学生招聘73222222222:中国就业网73222222223:汕头招聘网33222222224:看准网73222222225:数字英才网98754422226:浙江人才网73222222227:深圳人才网33222222228:湖南人才网73222222229:河南九博人才网73222222230:天津易才网1098765432当所有样本被聚成10类时,样本1属于第一类,样本2属于第一类样本3属于第二类,样本4属于第三类,样本5属于第三类,以此类推,当所有样本被聚成2类时,样本1、2、6、7、19属于第一类,其余样本属于第二类。更为直观的类别关系,我们可以从冰柱图中得出。图1 冰柱图图1 树状图从树状图中,我们可以看出,这种方法聚类比较理想,组内距离较小,组间距离较大。具体的聚类结果如表6所示。表 6 招聘网站聚类结果类别类规模(个)市、县名称17前程无忧、智联招聘、58同城招聘212过来人求职网、应届毕业生、1010兼职网、中国人才热线、南方人才网、528招聘网、若邻网、百才招聘网311中国就业网、汕头招聘网、看准网、数字英

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论