2017数学建模论文.doc_第1页
2017数学建模论文.doc_第2页
2017数学建模论文.doc_第3页
2017数学建模论文.doc_第4页
2017数学建模论文.doc_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

“拍照赚钱”的任务定价摘要小四宋体关键词:支持向量机 主成分分析1.问题重述“拍照赚钱”是用户下载APP,注册成为APP的会员,然后从APP上领取需要拍照的任务,赚取APP对任务所标定的酬金的过程。APP成为该平台运行的核心,而APP中的任务定价又是其核心因素。如果定价不合理,有的任务就会无人问津,而导致商品检查的失败。本题给出附件一:已结束项目的任务数据;附件二:会员信息数据:附件三:新项目任务数据(只有任务的位置信息)。1. 研究附件1中的项目,任务定价规律,分析任务的未完成原因。2. 为附件1中的项目设计新的任务定价方案,和原方案进行比较。3. 实际情况时,多个任务可能因为位置较为集中,导致用户会争相选择,一种考虑是将这些任务联合在一起打包发布。在这种考虑下,如何修改前面的定价模型,对最终任务完成的情况有什么影响?4. 对附件三中的新项目给出自己的任务定价方案,并评价该方案的实施效果。2. 基本假设1)2)3)4)5)3. 符号说明序号符号符号说明1X1维度2X2经度3X3任务标价4X4任务完成情况5Q1原方案成本6Q2新方案成本789104问题(1)的模型建立、求解4.1 问题分析 对于问题一,我们主要研究了附件一中的四项数据(任务gps维度、任务gps经度、任务标价、任务执行情况)。通过初步观察任务的gps经纬度都和任务标价、任务执行情况相关,为了进行详细分析,我们采用了主成分回归分析法。4.2 模型准备主成分分析的目的主要是用较少的变量转化成彼此相互独立或不相关的变量,通常是选出比原始变量个数少,能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。由此可见,主成分分析实际上是一种降维方法。主成分分析的结果受量纲的影响,如果改变量纲,则会由于各变量的单位可能不同而导致结果不一样,而回归分析是不存在这样的情况的,所以可以先把各变量的数据标准化,使用相关系数矩阵进行分析。我们使用主成分回归分析,是为了克服最小二乘(LS)估计在数据矩阵中存在多重共线性时表现出的不稳定性。我们选择其中一部分重要的主成分作为新的自变量,丢弃了一部分影想不大的自变量,实际上达到了降维的目的,然后用最小二乘法对选取主成分后的模型参数进行估计,最后再变成原来的模型求出参数的估计。4.3 模型建立与求解4.3.1:数据的初步处理 由于附件一所给数据量纲不同,且数值差过大,我们对该数据进行了统一处理,处理如下(下表只显示部分处理数据,详细请看支撑材料):表1 附件一部分数据任务号码任务gps 纬度任务gps经度任务标价任务执行情况A000122.56614113.9808660A000222.68621113.940565.50A000322.57651113.957265.51A000422.56484114.2446750A000522.55889113.950765.50A000622.559114.2413750使用Excel求得任务经纬度和任务标价平均值后,分别除以所有该项目数据,得到如下(部分)结果:表二 附件一处理后数据任务号码任务gps 纬度任务gps经度任务标价任务执行情况A00010.9818819961.0039047610.954989604 0A00020.9871060931.003549710.9477548340A00030.982333191.0036965580.9477548341A00040.9818253691.0062276441.0852154590A00050.9815663431.0036395260.9477548340A00060.9815711871.0061989861.0852154590平均值22.98254238119.537538569.1107784.3.2主成分分析回归模型4.3.2.1 完成情况(X4)分析首先我们利用Matlab软件求出任务gps维度X1,任务gps经度X2,任务标价X3的相关系数矩阵r和矩阵的特征值那么大,特征向量n,特征值贡献率表3 X1,X2,X3相关系数矩阵X1X2X3X11.0000-0.52060.0855X2-0.52061.0000-0.0597X30.0855-0.05971.0000相关系数矩阵的三个特征值依次为nameda1.54010.98110.4787特征向量0.6969,-0.6924,0.1868 -0.1069,0.1573,0.9817 0.7091,0.7042,-0.0357 各个特征值的贡献率51.337632.704415.9581前两个特征值的和所占比例(累积贡献率)达到:51.3376+32.7044,由此略去第三个成分。保留前两个成分(特征值)对应的两个特征方程为:Z1=x1+x2+x3Z2=x1+x2+x3对附件1处理后的数据直接做线性回归得经验回归方程得:y=-20.056232+10.673738*x1+8.624116*x2+1.383294*x3作主成分回归分析,得到回归方程Y=【0.1580,0.1672】【z1,z2】化成标准化变量的回归方程为Y=0.0922-0.08310.1936 x1 x2 x3恢复到原始的自变量,得到主成分回归方程:y=7.246556+4.192986*x1-12.250940*x2+1.436457*x3由上可得,任务完成情况的好坏与维度和任务标价成正比关系,与经度成反比关系,且经纬度x1,x2 前的系数明显大于定价x3前的系数,由此,经度越高,维度越低的任务完成情况越好,定价将略微影响任务的完成情况,定价越高完成情况越好4.3.2.2任务标价(X3)分析与完成情况分析相仿求出相关系数矩阵r与矩阵的特征值那么大表4 X1,X2,X4相关系数矩阵rX1X2X4X11.0000-0.52060.2202X2-0.52061.0000-0.0749X40.2202-0.07491.0000特征值1.59500.94670.4583特征向量0.6876-0.64390.3356-0.0935 0.37980.92030.72000.6642-0.2009 各个特征值的贡献率53.166031.557715.2763前两个特征值的和所占比例(累积贡献率)达到:53.1660+31.5577,由此略去第三个成分。保留前两个成分(特征值)对应的两个特征方程为:Z1=x1+x2+x3Z2=x1+x2+x3对附件1处理后的数据直接做线性回归得经验回归方程y=1.449027+0.160356*x1-0.625815*x2+0.026279*x3作主成分回归分析,得到回归方程Y=0.1037 0.1650 z1 z2化成标准化变量的回归方程为Y=0.0559 -0.00410.1867 x1 x2 x3恢复到原始的自变量,得到主成分回归方程y=0.723047+0.342375*x1-0.081159*x2+0.025162*x3 由上可得,任务的定价与维度和任务标价成正比关系,与经度成反比关系,且经纬度x1,x2 前的系数明显大于任务的完成情况x4前的系数,由此,经度越高,维度越低的任务定价越高,任务的完成情况略微影响任务定价。4.3.2.3模型的初步检验由以上两个主成分回归分析方程可得 ,高定价的情况下,任务的完成情况较好。我们做出任务完成和任务未完成的标价与地理位置(任务gps经纬度)散点图:图3 标价与地理位置散点图(任务完成)图4 标价与地理位置散点图(任务未完成)其中在高标价段,任务完成的个数明显较未完成的个数多,由此可见主成分回归方程可信度较高。由上可得任务定价规律:在经度高,的地区,定价较高;在经度低,维度高的地区,定价较低。未完成的原因:与定价规律相似,在经度高,维度低的地区,完成度较高;在经度低,维度高的地区,完成度较低。结合定价规律可得,未完成的原因是由于在该地区的定价稍微偏低引起的。 5. 问题(2)的模型建立、求解5.1 问题分析与求解为附件一中的项目设计新的任务定价方案,并和原方案进行比较。由第一问可得任务定价与任务完成情况之间关系不大,但两者都与任务的经纬度有关(也就是与任务的地理位置有关),当任务地理位置的纬度高经度低时,任务的完成度和任务的定价都较高,这种安排很不合理。由此我们得出新的任务定价方案,在纬度高经度低时(任务完成度情况好),降低定价;在纬度底经度高时(任务完情况不好),提高定价。该方案的与原方案比较(1) 完成情况不好的地方通过提高定价,刺激该地区人群尽力完成任务(2) 完成情况好的地方通过降低定价,舒缓该地区的竞争。(3) 通过降低完成情况较好的地方的任务定价,可同时降低公司总的支出金额(需要付给用户的总金额)如下计算原方案和新方案公司的支出金额:方案的总支出金额=任务定价*任务完成情况(详细计算可见支撑材料fujian1.xls)原方案Q1=seigemax3*x4=36446新方案:我们将维度大于平均值,经度小于平均值的地区任务提高5元,把维度小于平均值,经度大于平均值的地区任务定价降低5元,而后计算支出总金额Q2= (11)7298.5+(10)5943+(00)5173.5+(01)10631=29046Q20fprintf(+%f*x%d,hg1(i),i-1);elsefprintf(%f*x%d,hg1(i),i-1)endendfprintf(n)r=corrcoef(x0)xd=zscore(x0);yd=zscore(y0)vecl,lamda,rate=pcacov(r)f=repmat(sign(sum(vecl),size(vecl,1),1);vec2=vecl.*fcontr=cumsum(rate)df=xd*vec2;num=input(请选项主成分的个数:)hg21=df(:,1:num)ydhg22=vec2(:,1:num)*hg21hg23=mean(y0)-std(y0)*mean(x0)./std(x0)*hg22,std(y0)*hg22./std(x0)fprintf(y=%f,hg23(1);fori=2:nifhg23(i)0fprintf(+%f*x%d,hg23(i),i-1)elsefprintf(%f*x%d,hg23(i),i-1);endendfprintf(n)rmse1=sqrt(sum(hg1(1)+x0*hg1(2:end)-y0).2)/(m-n)rmse2=sqrt(sum(hg23(1)+x0*hg23(2:end)-y0).2)/(m-num)附录2 问题(3)任务分类打包a0=load(fenlei,txt);a=a0;b0=a(:,1:27);dd0=a(:,28:end);b,ps=mapstd(b0);dd=mapstd(apply,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论