B201725001130_马启成_杨茂涛_陈一铭.docx解读_第1页
B201725001130_马启成_杨茂涛_陈一铭.docx解读_第2页
B201725001130_马启成_杨茂涛_陈一铭.docx解读_第3页
B201725001130_马启成_杨茂涛_陈一铭.docx解读_第4页
B201725001130_马启成_杨茂涛_陈一铭.docx解读_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、拍照赚钱”的任务定价摘要随着移动互联网的普及, “拍照赚钱” 成为了移动互联网下的一种新的调查 方式,因其与传统调查方式相比有诸多优点而备受人们关注, 但也因其 app 里的 任务定价问题而导致用户不愿意对某些定价的商品进行调查而导致调查不够充 分,因此,为使定价更合理,调查更充分,本文就“拍照赚钱” app 里的任务定 价问题展开了讨论和分析。针对问题一: 本文首先对附件一中所有数据进行聚类分析, 按任务的完成情 况分成任务完成较好, 任务完成较差以及任务完成情况适中三个部分, 对每个部 分中的数据用二元线性回归分析得出三个任务定价与任务经纬度的回归模型, 再 运用高维插值法分析任务标价与任

2、务经纬度的关系, 得出不同区域内的任务标价 与其任务经纬度都有密切关系,并且不同区域任务经纬度对定价的影响是不同 的;然后结合附件二中所给数据,并运用 matlab 画出任务位置、会员位置、任 务定价和完成情况的关系图, 分析得出任务未完成的原因有两点: 一是会员位置 与任务位置相对集中导致会员之间的竞争增大; 二是任务定价较低导致会员获得 的报酬减少。针对问题二: 通过对附件一中聚类分析后所得数据一一进行分析, 建立非线 性回归模型,与问题一所建立的模型进行分类比较, 结合原始数据中的任务定价, 代入各部分所包含的数据, 对两种模型进行分析, 通过分析得到: 若要使模型更 接近于实际情况,则

3、应该使用问题一中所建立的模型,若要使任务定价更平稳, 则应该使用问题二中所建立的模型。针对问题三: 本文以图二中数据较多, 任务完成情况适中, 最具有代表性的 part1 为例进行分析,考虑到打包方式的不同,将打包情况分成三种:两个任务 为一包:“ 10”;三个任务为一包:“ 110”;和四个任务为一包:“ 1100”三 种情况,“ 1”代表完成、“ 0”代表未完成,并结合任务位置与会员位置之间的 距离、会员信誉度等因素,运用多元线性回归分析法 , 建立并求解得最终的打包 任务定价模型, 通过分析得到: 将任务打包后任务的完成情况具有两面性, 一方 面由于报酬的增加而导致完成率上升, 另一方面

4、由于任务难度的增加而导致完成 率下降。针对问题四:通过对问题一、问题二、问题三中所建立模型的研究分析,根 据附件三中所给出的任务经纬度位置, 结合上述模型进行求解, 得出附件三中每 个任务的任务定价, 分析得出该方案的实施效果比问题一与问题二中所建模型的 效果更佳。关键词 : 任务标价 回归分析 曲线拟合 插值法 聚类分析法1、问题重述1.1问题背景当前,“拍照赚钱”已成为移动互联网下的一种自助式服务模式。它通过用 户下载APP并注册成会员,然后从APP上领取需要拍照的任务并赚取任务所标定 的酬金。与传统调查模式相比,这种调查模式可以大大节省调查成本, 并且增加 了调查数据的真实性,缩短了调查

5、周期。但由于该模式以APP作为平台进行运行, 而APP中的任务定价又是其核心要素。如果定价不合理,有的任务就会无人问津, 而导致商品检查的失败,为了使调查更充分,需要对商品进行合理的任务定价。1.2问题提出本文根据相关数据,建立了数学模型研究了如下问题:(1)通过研究附件一中的数据分析该项目的任务定价规律,并分析未完成 的原因;(2)为附件一中的项目设计新的任务定价方案,并和原方案进行比较;(3)假设将位置比较集中的多个任务联合起来打包发布,应如何修改前面 的定价模型,这对最终的任务完成情况有什么影响;(4)运用所得模型,对附件三中的新项目给出新的任务定价方案,并评价 该方案的实施效果。2、模

6、型假设(1)假设统计出的这部分数据真实有效;(2)假设任务完成情况不受自然因素干扰,如天气等;(3)假设商品自身属性对用户的任务完成情况并无影响(排除用户会对某 些商品有特殊喜爱);(4)假设任务定价只与附件一中经纬度有关而与其他变量无关;(5)假设会员走的路程近视等于其位移;(6) 假设每一位会员的工作时间大致一样且均为每天的工作10小时;(7)假设会员去到任务所在位置就一定能完成任务;3、符号说明符号符号说明X1任务gps纬度X2任务gps经度y任务标价p0常数£二元线性回归时纬度前系数二元线性回归时经度前系数常数非线性回归时经度前系数非线性回归时纬度前系数常数多元线性回归纬度前

7、系数多元线性回归经度前系数实际完成打包数量前系数会员信誉值前系数xv任务平均纬度x2,任务平均经度X3会员实际完成任务的数量X4会员信誉值4、模型的建立与求解4.1问题一的分析与建模分析:(1)为研究附件一中的数据分析该项目的任务定价规律和未完成的原因, 应该对附件一中的所有数据进行聚类分析 ,得出任务完成情况分布图,再对整 体数据进行二元线性回归分析2,建立一个任务定价与任务位置的回归模型,分 析整体任务定价与经纬度的关系,但通过聚类分析可得不同地区的任务完成情况 是不大相同的,因此还需要对所有数据进行分开讨论,分成任务完成较好,任务完成较差,任务完成适中三个部分,对每个部分分别进行二元线性

8、回归分析, 建 立回归模型,运用插值法利用matlab画出各个模型所对应的任务定价图,通过图形分析各个区域得定价规律;(2)通过对附件一和附件二中的数据进行分析,发现任务完成情况与任务 位置、会员位置、任务定价均有关系,需要运用matlab画出它们之间的关系图, 分析得出任务未完成的原因。建模:4.1.1基于附件一中的数据分析该项目的任务定价规律 对于附件一中所给的836组数据,我们用excel分析可得:xi (任务gps纬 度)的范围为:22.4930831323.87839806,X2 (任务 gps经度)的范围为: 112.6832583114.4936096,通过查找gps地理位置可得

9、,该范围大致如图 1 所示:图1附件一中数据的地理位置大致分布图北至清远市,南至中山市,西至肇庆,东至惠州市。在分析出大致位置之后,运用聚类分析法,利用matlab1 作出任务完成情况 与任务经纬度的关系如图2所示:424订:与gps经険:O 芫戚图2任务完成情况与经纬度的关系图通过观察图二发现当任务位置位于第一部分时,任务完成情况适中,当任务 位置位于第二部分时,任务完成情况较好,当任务位置位于第三部分时,任务完 成情况较差。因此,为分析附件一中任务的定价规律,需要对所有数据进行整体分析,再 将这些数据分成三个部分逐个进行分析,第一部分为part1(22.8<x i<23.6;1

10、12.6<x 2<113.6),数据如支撑材料中“ parti 中的数据” 所示,第二部分为part2(22.8<x i<23.2;113.6<x 2<114.2),数据如支撑材料中“ part2 中的数据”所示,第三部分为 part3(22.4<x i<22.8;113.8<x 2<114.6), 数据如支撑材料中“ part3中的数据”所示;建立y (任务标价)与自变量xi (任务gps纬度)、X2 (任务gps经度)之 间的模型如下:4.1.11第一,运用matlab将附件一中所有数据代入得:r =-25.2944 2.4837

11、=0.3286所得整体数据任务定价的回归模型为y=-25.2944+2.4837xi +0.3286x24.1.1 2根据所得模型,运用插值法,通过 matlabe绘制图像如图3所示:1图3整体数据任务经纬度与价格的的关系图通过对该图进行分析可得:纬度对任务定价的影响大于经度对任务定价的影 响,西北和东北方向的任务定价明显高出其他地方的任务定价,并且西南方向上的任务定价明显低于其他地方很多。第二,运用matlab将parti中所含数据代入得:=969.9949"2.7655-8.5195所得parti中任务定价的回归模型为:y =969.9949 2.7655x1-8.5195x24

12、.1.1-3根据该模型,运用插值法,通过 matlab问绘制图4如下所示:6200、113.5-.斗23113任务gpg经度23112522 启f:l:务 gps 纬度图4part1中任务经纬度与价格的关系图通过对该图进行分析可得:该区域的任务标价和纬度的关系比较大, 并与纬 度成正相关,与经度成负相关,西北方向的任务定价明显高于其他方向的任务定 价。第三,运用matlab回将part2中所含数据代入得0 =-1390.3+ 1.2-2 =12.6所得part2中回归模型为:y =-1390.3 1.2治+12.6乂24.1.1-4以同样的方法,运用 matlabv绘制图5:78图5 part

13、3中任务经纬度与价格的的关系通过对该图分析可得:该区域的任务定价靠近东北方向相对较高,而靠近西南方向任务定价相对较低,而东北和西南方向上的任务定价相对一致。第四,运用matlab问将part3中所含数据代入得:*-536.9091"11.9376=2.9338所得part3中回归模型为:y =-536.9091 11.9376為+2.9338乂24.1.1-5根据模型,运用matlab绘制图6:图6从该模型和图像可以分析出,该区域内东西部的任务定价相对较高, 而中部 任务定价相对较低,并且中南方向的任务定价明显低于中北方向上的任务定价。4.1.2基于经纬度和定价的影响分析任务未完成的

14、原因根据附件一和附件二可得出任务完成情况可能与任务位置、任务定价、会员位置均有关系,所以需要一一对其进行分析。根据附件一中的835组数据和附件二中的1877个数据,运用matlabg画出 会员位置和用户位置的对比图如图 7所示:图7会员位置与用户位置关系图9根据附件一的任务元成情况,运用matlab】画出任务元成情况和任务位置的对比图如图8所示:1 仲122.422JS232任环曲览23110#图8任务完成与未完成的对比图对图进行分析可得:会员比较密集的区域,如东南和西北方向,可能因为会 员之间竞争比较激烈,用户不容易赚到钱,就不愿意去完成拍照任务,导致任务 完成情况相对较差;而会员相对分散的

15、区域,如图中的中间部分,可能因为会员 之间的竞争少了很多,会员更容易赚到钱钱,因此,会员更愿意去完成拍照任务, 导致任务完成情况相对较好。对于附件一中的数据,运用 matlab 12绘制出任务价格与任务完成情况的关 系如图9所示:65M?5an總 昭 圃 S莘嗨担图9任务价格与任务完成情况的对比图通过分析图中数据可得:当任务价格在 75以上时,任务完成的情况要远远 高于任务未完成的情况,且任务未完成的数量相对较少;当价格在7075时,任务完成情况一般,完成数量比未完成数量略高;当任务价格低于 70时,任务未 完成的数量占比增大,未完成的情况增多,任务完成率较差。综上所述,任务未完成的原因共有两

16、点:一是会员密度,会员密度大的地区, 会员之间的竞争剧烈,使得会员通过拍照赚钱的难度增大, 多数会员不愿意通过 此方式赚钱,造成任务未完成情况增多;二是任务定价,任务定价低的任务完成 情况较差,因为在同等条件下,完成低价任务使会员所赚的钱减少, 造成任务未 完成率增大。4.2问题二的分析与建模:分析:要得到附件一中数据新的定价方案并与原方案进行对比,首先应为附件一中的任务定价制定出新的模型,同样利用问题一中聚类分析得出的结果, 将数据分 成三个部分,建立属于各个部分的定价模型,并把两种方式建立的模型进行比较, 得出适合于各个部分的任务定价模型。建模:考虑到附件一中任务定价只与任务位置有关, 所

17、以,首先建立非线性回归模 型:y=3x_14X15X24.2111#将所有数据代入模型中用 matlab少】求解得:3 =1.3348 ,=0.001 0.0103 由此得出整体数据新的任务定价方案模型为:4.2-21.3348x21 0.001x1 0.0103x2将part1中所包含的数据代入模型中用matlab14求解得:一:3 = 1.3387 0.0015 0.0102由此得出part1新的任务定价方案模型为:4.2-31.3387X21 0.0015q 0.0102x2将part2中所包含的数据代入模型中用 matlabg求解得:h = 1.33594 =0.0014 0.0101

18、由此得出part3中新的任务定价方案模型为:4.2- 41.3459X21 0.0014x10.0101x2将part3中所包含的数据代入模型中用matlab跑 求解得:12# 1.3348"0.001:5 =0.0103运用由此得出新的定价方案模型为:4.2-51.328&21 0.001* 0.0105X.运用matlabg将每个部分的所有数据代入,画出两种方式所得模型计算出的 定价与原有定价的对比情况如图10所示:全西載IKJ?LhH"-.沿仔备httpah IXu O7 7pariM 1(M130 ZQQ Z3Q 30VW30D£5图 10 不同模

19、型建立的任务定价比较图通过对上图进行分析可得: 若要对整体区域进行讨论, 因数据较多, 差异性 较大,两种模型的效果差别不大,两种模型均可行;若要对part1、 part2、 part3的定价方式进行研究, 多元线性回归所构建的模型要更加接近真实值; 其次,若 需要所得定价数据相对平稳, 则选用非线性回归模型效果更佳, 若想要任务定价 有些许波动的情况,则选用多元线性回归模型效果更佳。4.3 问题三的分析与建模:分析:考虑到要将任务打包起来发布, 当然就不可以用原来的定价模型, 在 此,应考虑任务打包的情况,如将两个在一起打包,三个在一起打包,四个在一 起打包三种情况,为了使任务完成率提高,所

20、打包的任务就不能随便进行打包, 应该将完成情况好的和完成情况不好的做成一个包,本文选择完成情况适中的 part1 区域进行分析,建立定价模型,通过模型研究打包发布对任务完成率的影 响。选取 part1 而不选其他区域的理由如下:因为 part2 这一块地方中的任务几乎全部完成, 而打包的目的在于提高任务 的完成率, 运用打包方案对 part2 中的任务完成率的提高效果微乎其微, 所以不 用分析 part2 这个区域;而对于 Part3 ,原有任务的完成率已经够低了,如要再 对任务进行打包,反而使原有任务的完成率降低,因此也能选 part3 这个区域; 而对于 Part1 这个区域, 任务完成率

21、比较适中, 可以通过将执行情况好的和执行 情况差的打包在一起发布来提高任务的完成率, 这样单个会员可以赚到比原来更 多的钱,会员更愿意去完成任务, 提高了会员完成任务的积极性, 所以,对 part1 进行打包是十分有必要的。打包情况的建立:由于 part1 这块地方中的完成任务数和未完成任务数的比值为 289:182, 约 为 1.588 : 1,所以我们采取 10'、 110'和 1100'这三种打包方式( 1' 代表完成, 0'代表未完成)。设:10的打包方式有a种,110的打包方式有b种,1100的打 包方式有c种(a,b,c为整数)。建立方程如下

22、 ;a+2b+2c=289,a+b+2c=182,c=2a解得 a=15,b=107,c=30所以可以把打包方案分为三类,第一类为15个10组,第二类为 107个110组,第三类为 30 个1100组, 一共 152组。对 part1 中的原始数据根据上述分析进行分类打包如支撑材料中 “打包情况分类”所示,并且在建立方程式时,还需要把会员实际完成的任务数量和会员的 信誉值考虑在其中。在假设条件成立的情况下,经过推算可得:会员每天实际完成任务数量=每天行驶总路程/ (会员平均行驶速度*会员每天的工作时间)建模:首先建立多元线性回归模型:y=飞7X1,nX?9X30X44.3-1%,二任务平均纬度

23、X2,二任务平均经度X3=会员实际完成任务的数量X4 =会员的信誉值经过对第一种打包情况“ 10”的15个组数据进行分析可得若会员要完成任 务,则会员的平均行驶速度需为 27.348km/小时,也就是说对于1100这个打 包方式,会员一天最多完成一个打包任务。同理可得30个1100和107个 110'组数据中的会员每天最多完成的打 包数如支撑材料中“打包情况分类”所示。由于把打包情况分成了三种,所以需要建立三种模型:第一种“10”情况:代入数据,用飞=0matlab阴求解得:% = -141哄-106-9 =1554110=0所得第一种情况的定价方程为:y=(10A4)*( -0.01

24、41X1, -0.0106X2, 1.5541X3)4.3-2第二种“ 110”情况:代入数据,用matlab 19求解得:-6=0=17.1760 订二-0.4610 一:9 =-139.420410=0.004915所得第二种情况的定价方程为:y=17.176xr -0.4610X2, -139.4204X3 0.0049&4.3-3第三种“ 1100”情况:代入数据,用matlab 20求解得:飞=3898.17=-43.98 =-41.39=010 = -32.3所得第一种情况的定价方程为:y=(10A3)*( 3.8981-0.0439x1,-0.0413x2,0.0323x

25、4).4.3-4通过对上述方程进行分析,得出打包对任务完成情况产生的影响:(1)在条件假设均成立的情况下,对任务进行打包,将会提高任务的完成 率。(2)但也存在不足之处,比如:将任务放在一起打包分布表面上可以通过 金额的提升来提高会员的积极性,但是在任务进行打包时是将任务执行情况好的 和不好的打包在一起,这反而增加了任务的完成程度,即必须将所有任务均完成 后才可以领取酬金,有些会员可能会因为无法解决打包任务中的部分问题而放弃 整个打包任务,导致完成率下降。4.4问题四的分析与求解:分析:要对附件三中所给位置的任务进行定价, 需要我们结合前面所构建的 模型,并将附件三中的任务位置代入到所构建的模

26、型中进行分析, 得到最终的任 务定价。求解:将附件三中的任务位置数据代入问题三中所建立的模型求解可得附件三的 部分任务定价如表一所示,完整定价数据请参考支撑材料中“附件三任务定价数 据”。表一 附件三中任务定价表任务定价(第一类,四个任务定价(第二类,任务号码任务GPS纬度任务GPS经度任务打包在一起)三个任务打包在一起)任务定价(第三类,两个任务打包放在一起)C000122.73004117114.2408795226.5309693198.3257418137.1710308C000222.72704287114.2996199220.7272421198.2471636137.19462

27、37C000322.70131065114.2336007231.3535265197.8356218137.0235457C000422.73235925114.2866672221.3506251198.3444489137.2125457C000522.71839144114.2575495226.4065553198.1179611137.1240841C000622.75392493114.3819253208.2125048198.670947137.3820841C000722.72404221114.2721836224.0585909198.2082723137.161741

28、9C000822.71937803114.2732478224.6034315198.1276699137.1392704C000922.73028254114.2304955227.5976368198.3346744137.1654261对于应用打包任务模型进行定价的方法, 可以在定价合理的的基础上大幅度 提高会员所赚酬金, 提高会员积极性, 以此来提高任务的完成率, 从这方面考虑, 该种定价方法比问题一问题二中所构建的定价方法效果更好。5、模型的检验由于问题二的最后已经对多元线性回归和非线性回归进行过检验并进行了 对比,因此,不在此过多赘述。6、模型的优缺点7.1 模型的优点(1)本文先

29、对整体进行讨论, 又对任务完成情况不同的区域分开进行讨论, 所以得出的模型既可以用来对整体进行定价, 也可以对局部区域进行定价, 所以 模型更加具体、可靠。(2)讨论出将任务进行打包的定价模型,使得在合理定价内大大提高会员积极性。(3)模型中还考虑到了会员工作时间、会员信誉度,会员任务完成数量及 会员位置与任务位置之间的距离对定价的影响,使得模型更加符合实际情况。7.2模型的缺点该模型未考虑到任务难易程度、人口密度、交通发达程度以及会员活跃程度对定价的影响7、模型的改进模型的改进:(1)、应该引入残差e来使得模型计算的结果更准确。(2)、在实际过程中,会员到哪一个地方去完成拍摄任务往往会与到达

30、该地方的便捷程度:有关,所以在建立多元线性回归模型时应该把便捷程度:当作自变量带入模型进行计算(我认为便捷程度与路网密度和车辆行驶速率等因素有 密切关系)。&参考文献1 黄祖庆、牛阿凤,模糊聚类分析在数学建模中的应用J.淮北师范大学 学报(自然科学版),1999(3):17-21.2 王学仁、王松桂编译,实用多元统计分析M.上海:上海科学技术出版 社,1990.3 谢继深.模糊控制技术中一种特殊的高维插值法J.电路与系统学报, 1997(2):66-69.4 GPS 经纬度查询,网址:http:/www.gpsspg.eom/maps.htm5 偏最小二乘回归的线性与非线性方法M.国防

31、工业出版社,王惠文,2006. 卓金武,等.MATLAB在数学建模中的应用第二版 P.北京:北京航天航空 大学出版社,2014.9.7两个经纬度之间的距离计算,网址:http:/www.storyday.eom/wp-eo nten t/uploads/2008/09/latl un g_dis.ht ml9、附录matlab 程序如下:注:由于数据较多,真实代码所占篇幅比较大,不可能附在附录中,附录中 仅显示剔除数据后的代码, 也就是代码的基本骨架, 但数据所在位置已用文字标 志出,完整代码已在支撑材料中标志,若需要完整代码,请参照支撑材料!1 、任务完成情况与任务经纬度的关系 matlab

32、 代码骨架如下:x1= 已完成任务的纬度 'y1= 已完成任务的经度 'x2= 未完成任务的纬度 'y2= 未完成任务的纬度 'h1=plot(y1,x1,'or')xlabel(' 任务 gps 经度 ')ylabel(' 任务 gps 纬度 ')hold onh2=plot(y2,x2,'xk')legend(' 已完成 ',' 未完成 ')2 、4 、6 、8 中运用 matlab 计算二元线性回归模型的代码骨架如下: x1= 纬度;x2= 经度;y= 任务标价

33、 ;x=ones(,1) x1 x2;b,bint,r,rint,stats=regress(y,x);b,bint,stats,rcoplot(r,rint)3 、5 、 7 、 9matlab 插值代码骨架如下如下:x= 纬度'y= 经度'z= 任务标价 'scatter3(x,y,z, '.' )figurex,y,z=griddata(x,y,z,linspace(min(x),max(x)',linspace(min(y),max(y), 'v4' );pcolor(x,y,z);shading interpfigure

34、,contourf(x,y,z)figure,surf(x,y,z)xlabel('任务 gps纬度)ylabel('任务 gps经度)zlabel( ' 任务标价 ' ) 10 x1= 会员经度 'y1=会员纬度'x2= 任务经度 'y2= 任务纬度 'h1=scatter(x1,y1, '.r')xlabel( ' 纬度' ) ylabel( '经度') axis(22 24 112 115) hold onh1=scatter(x2,y2, '.k' ) legend( '会员位置' ,'任务位置')13 、14 、15 、16 中运用 matlab 计算非线性回归模型的代码骨架如 下:clc;x1= 经度;x2= 纬度;x=x1 x2; y= 任务标价 ;f=(b

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论