搜索引擎广告收益数学模型_第1页
搜索引擎广告收益数学模型_第2页
搜索引擎广告收益数学模型_第3页
搜索引擎广告收益数学模型_第4页
搜索引擎广告收益数学模型_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数模模拟试题承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从a/b/c/d中选择一项填写): a 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(

2、请填写完整的全名): 湖北师范学院 参赛队员 (打印并签名) :1. 郑升林 2. 张 琴 3. 刘 玲 指导教师或指导教师组负责人 (打印并签名): 教练组 日期: 2012 年 8 月 27日赛区评阅编号(由赛区组委会评阅前进行编号): 数学模拟试题编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):2搜索引擎广告收益摘要 本文研究的是多种因素对google引擎广告收益的评估问题和对于广告收益最大化的影响因素的范围优化问题。根据这些特点,我们对

3、问题1用主成分分析法解决;对问题2优化用正态分布的方法解决对于问题1我们用matlab线性处理直接求出七个元素对于收益的系数首先建立了线性规划模型一。在对线性规划模型的基础上建立了主成分分析模型二。对模型进行做合理的理论证明和推导,所给出的理论结果大约为:然后借助于主成分分析法和spss,matlab软件,对附件中所提供的数据进行了筛选,去除异常数据,对残缺数据进行适当补充,并从中随机抽取了3组数据对理论结果进行了数据模拟,结果显示,理论结果与数据模拟结果吻合。对于问题2我们用spss进行q-q正态检验处理,首先建立了正态分布模型三。在对模型改进的基础上建立了正态分布优化模型四。对模型进行了合

4、理的理论证明和推导,所给出的理论证明结果大约为:cpc每次点击成本ctr点击率平均广告排名cpm每千次成本转化率每次转换费用无效点击优化上限1.450.014.458.640.0920.170.12优化下限0.0703.030.000.031.750如果在数据和时间允许的条件下,模型可以进行适当修改,可以进一步进行偏相关分析,使得这七种因素的影响更加显著。关键字: 主成分分析 matlab软件 spss软件 正态优化一、问题重述由于网络社会的飞速发展,网络广告也呈现了多种形式。与其它网站的广告推广方式相比,搜索引擎推广方式最为有效( 上图展示了部分搜索引擎标识)。搜索引擎广告可以向那些对广告产

5、品感兴趣的人展示广告,尽量避免无效展示。搜索引擎广告收益评估指标通常考虑以下几个方面的影响因素;广告显示次数、点击次数与点击率、每点击广告费用、转化次数与转化率、广告投资收益等几个方面。问题:以某一搜索引擎为例。1. 建立搜索引擎网络广告收益评估的数学模型;2. 为使得广告收益控制在某一范围或最大化,建立数学模型确定相应影响因素的范围。二、问题分析针对问题一,如今广告种类是多种多样的,我们将广告范围限制为一支,一个关键字。对于大量的多指标数据的综合评价,已经有了很多成型的算法,它能充分体现影响收益的主要因素,得到较为精确的结论。广告收益情况是由诸多因素影响所决定的,包括广告显示次数、点击次数与

6、点击率、每点击广告费用、转化次数与转化率、广告投资收益。考虑到各个因素间的相关性,所以做出两两因素相关性图及表格来分析数据是必须的;而各类因素对其影响力的大小也是各不相同,这时我们可以利用matlab软件对其因素进行主成分分析,找出基本上能够代替其他成分的主成分,便可以得到广告收益的评估模型。针对问题二,我们用spss进行q-q正态检验处理,首先建立了正态分布模型三。在对模型改进的基础上建立了正态分布优化模型四。三、模型假设1、假设表中数据真实可靠,不存在人为因素。2、假设表中数据具有时效性,短时间内没有波动性。3、短期类不会出现其他特殊因素 四、符号说明cpc 每次点击的成本()ctr 点击

7、率()r 平均广告排名()cpm 每千次成本(就是广告投放过程中 比如说一个广告 一条的单价是1元/cpm的 话,意味着每一千个人次看到这个广告的话就收1元)() 转化率()cpm 每次转换的费用() 无效点击()五、模型的建立与求解问题一的建立 1)初步分析数据,得到7个影响因素,依次是每次点击成本、点击率、平均广告排名、每千次成本、转化率、每次转换费用、无效点击,对其数据进行相关提取得到下表一: 年份cpc每次点击成本ctr点击率平均广告排名cpm每千次成本转化率每次转换费用无效点击年度广告收益2,0050.380.01504.005.560.038010.180.00323,377,06

8、0.002,0060.320.00704.002.380.04007.630.03506,322,797.002,0070.620.00303.901.950.07006.410.065010,624,705.002,0080.710.00304.002.160.07507.020.049014,413,826.002,0091.030.00303.603.340.060012.600.055015,722,486.002,0101.240.00703.708.550.068013.140.067019,444,000.002,0111.040.00403.003.970.053019.740

9、.109026,145,000.00为了找出因素间的联系,我们以cpc、cpm、cpw为因变量,平均广告排名, 转化率, 每次转换费用,无效点击四个因素为自变量,运用spss软件做出因素间的相关性图。以下是cpc与其他四个因素的关系图(cpc、cpm与其他四个因素的关系图见附录):表1 各因素数据统计表 从图中可以很明显的看到都是零散的点,说明cpc与其他四个因素是没有直接的关系,从而可以用综合变量代替其他变量来进行主成分分析。依靠上面的图像,我们运用matlab软件计算两两因素的相关性,得到如下表格 说明:每个框里面除开与自身相比的1和标志因素的7之外,有两组数值,其中person相关性越大

10、,说明这两个因素越相关,下面的显著性,越大,就说明相关性越弱就是你否定一个原假设时所犯的错误的概率,即p越小,你否定一个原假设时所犯的错误的概率就越小,如p=0,说明你否定一个原假设时所犯的错误的概率为0,你可以有100%的把握否定原假设。在做相关性分析时,我们的原假设是没有相关性,p=0,就否认了没有相关性,于是就可以讨论他们的相关性。2) 主成分分析法,通过提取主成分的方法对数据进行综合评价,将主要影响收益因素作为评估指标,计算指标的相关系数矩阵的特征值和特征向量来寻求主成分,最终通过主成分进行综合评估。问题一的求解首先,运用matlab软件对原始数据进行标准化处理。得到标准化后的矩阵:

11、0.0712 0.3571 0.1527 0.1992 0.0941 0.1327 0.0084 0.0599 0.1667 0.1527 0.0853 0.0990 0.0995 0.0913 0.1161 0.0714 0.1489 0.0699 0.1733 0.0836 0.1696 0.1330 0.0714 0.1527 0.0774 0.1856 0.0915 0.1279 0.1929 0.0714 0.1374 0.1197 0.1485 0.1642 0.1435 0.2322 0.1667 0.1412 0.3063 0.1683 0.1713 0.1748 0.1948

12、 0.0952 0.1145 0.1422 0.1312 0.2573 0.2844再计算特征值、方差贡献率以及各指标的相关系数矩阵。对于给定的七个因素,求因素间的相关系数。相关矩阵中的每一个元素由相应的相关系数所表示。由于 ,故 ,从而由此可得 与 的相关系数为 即可得到相关系数矩阵: 1.0000 -0.4546 -0.6670 0.4987 0.5485 0.6601 0.7073 -0.4546 1.0000 0.3357 0.4944 -0.7079 -0.0422 -0.7023 -0.6670 0.3357 1.0000 -0.1713 -0.0161 -0.9377 -0.83

13、49 0.4987 0.4944 -0.1713 1.0000 -0.0653 0.4384 -0.0107 0.5485 -0.7079 -0.0161 -0.0653 1.0000 -0.1572 0.4447 0.6601 -0.0422 -0.9377 0.4384 -0.1572 1.0000 0.6419 0.7073 -0.7023 -0.8349 -0.0107 0.4447 0.6419 1.0000再求相关矩阵为 特征值和特征向量求解特征方程: 即解七元一次方程组,其系数矩阵为:a = 0.3800 0.0150 4.0000 5.5600 0.0380 10.1800 0

14、.0032 0.3200 0.0070 4.0000 2.3800 0.0400 7.6300 0.0350 0.6200 0.0030 3.9000 1.9500 0.0700 6.4100 0.0650 0.7100 0.0030 4.0000 2.1600 0.0750 7.0200 0.0490 1.0300 0.0030 3.6000 3.3400 0.0600 12.6000 0.0550 1.2400 0.0070 3.7000 8.5500 0.0680 13.1400 0.06701.0400 0.0040 3.0000 3.9700 0.0530 19.7400 0.109

15、0 通过求解特征方程,可得到个特征值 ,和对应于每一个特征值的特征向量。设 是的协方差矩阵,的特征值及相应的正交单位化特征向量分别为 及则 的第 个主成分为 (3)此时 用matlab软件,可解得的特征向量及特征值:特征向量: -0.4832 0.3413 0.1105 0.5210 -0.3792 -0.0572 0.4683 -0.4181 0.2711 -0.5039 -0.3123 -0.1042 -0.5398 -0.3131 -0.5067 -0.5443 0.2664 0.0091 -0.3525 0.2000 -0.4601 0.4025 -0.0990 0.3616 -0.2

16、397 -0.6031 -0.5123 0.1179 0.1438 -0.1191 -0.6056 -0.2025 -0.5248 0.4754 0.2365 -0.0827 -0.6998 -0.2983 0.1986 0.2224 -0.4018 0.4051 -0.3815 -0.0043 0.2763 -0.7022 0.1805 0.1243 0.4869特征值val : -0.0000 0 0 0 0 0 0 0 0.0042 0 0 0 0 0 0 0 0.0767 0 0 0 0 0 0 0 0.1167 0 0 0 0 0 0 0 1.0835 0 0 0 0 0 0 0 2

17、.0505 0 0 0 0 0 0 0 3.6683以上特征值、方差贡献率的结果如表2所示,各指标的相关系数矩阵的特征值如表3所示,解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %14.64258.02558.0254.64258.02558.02522.05125.63283.6562.05125.63283.65631.08413.54597.2011.08413.54597.2014.1181.47198.6725.078.98099.6526.028.348100.00072.532e-163.165e-15100.00082.042e-172.55

18、2e-16100.000表2 方差分析表 成份矩阵a成份123cpc每次点击成本.895.082.392每次转换费用.777.575-.233ctr点击率-.597.773.110平均广告排名-.879-.286.369cpm每千次成本.227.734.627转化率.456-.681.545无效点击.932-.178-.190年度广告收益.990.001.007 表3 相关系数矩阵的特征量年份综合排序200522.2902200616.1241200714.387200815.5535200924.1223201029.5527201133.9381 表4 综合排名 最后提取主成分,如表2所示

19、提取前三个特征值为主要成分,这三个累计贡献率达到,基本上反映了全部7个因素所具有的信息,能在一定程度上对广告收益进行综合评估。利用spss统计软件进行数据的处理,得出相关系数矩阵的特征量(见表3)。荷载主成分载荷是反映主成分 在spss软件中主成分分析后的分析结果中,“成分矩阵”反应的就是主成分载荷矩阵。进而得到主成分的表达式可以表述为,也是我们所要求得的广告收益评估模型:提取主成分。如表3所示,提取前3个特征值的主成分,这两个主成分的累计方差贡献率达到97.201%,表明提取的前3个主成分可以基本反映全部8个指标所具有的信息,能在一定程度上说明搜索引擎广告收益的综合因素。笔者利用spss统计

20、软件进行数据的处理,得出相关系数矩阵的特征值(见表3),并进而用matlab来检验(程序见附录),进而得到主成分的表达式可以表述为:其中各因素的比例系数只是代表影响能力的强弱,cpc每次点击成本,平均广告排名,和无效点击在第一主成分中占得比例突出的很明显,说明cpc每次点击成本,,平均广告排名,和无效点击对于搜索引擎利益的影响很大,处在第一梯队,而平均广告排名,转化率,每次转换的费用处在第二梯队,cpm每千次成本处在第三梯队,所以未来google的发展应该更注中第一梯队中的ctr点击率,平均广告排名,和无效点击,按重要性给予各个梯队的关注,因为它们的改善更加能够影响搜索引擎利益。问题二的模型与

21、求解对原始数据进行标准化处理计算出各地区的综合得分(见表4),不表示搜索引擎广告获得能力差,评价分值只是反映了搜索引擎广告获得利益能力的相对强弱。从表4的综合排名可以看出,所有的年份得分都为正值,这种代表着google一直在发展。经过分析2005-2007年这一阶段,google的评价分值一直在降低,并在2007年达到了极点,这说明了google在这一段时期没有科学的调配好资源,使得资金没有合理的分配到影响它利益的相关方面,在2007-2011年间,恰恰相反,评价分值在高速增长,所以通过比较这影响两个区间段的各种因素,为我们可以给出合理的控制影响因素方案提供了基础。七个因素的描述统计量n极小值

22、极大值均值标准差cpc每次点击成本7.321.24.7629.35160ctr点击率7.0030.0150.006000.0043589平均广告排名7343.74.364cpm每千次成本71.958.553.98712.37290转化率7.0380.0750.057714.0146369每次转换费用76.4119.7410.96004.69847无效点击7.0032.1090.054743.0323491有效的 n (列表状态)7联合第一问的分析,适当的缩小cpc每次点击成本的范围,能使得获得利益能力稳定,也就是确保利益的最大化,以下就是cpc每次点击成本的正态分布q-q图,和cpc每次点击成

23、本的趋势正态q-q图经研究发现cpc每次点击成本满足正态分布条件。正态曲线下,横轴区间(,)内的面积为68.268949%,横轴区间如果是(,)内的面积为95.449974%,横轴区间(,)内的面积为99.730020%所以对范围进行优化处理,将上表中的cpc每次点击成本的均值和标准值进行那么这个就是优化之后的范围了:优化上限优化下限1.4520360.073764在这个范围里面能够确保利益的最大化接着对剩余的6个因素进行同样的分析得到 均值标准差优化上限优化下限cpc每次点击成本0.76290.35161.45 0.07 ctr点击率0.0060.00435890.01 0.00 平均广告排

24、名3.740.3644.45 3.03 cpm每千次成本3.98712.37298.64 0.00 转化率0.0577140.01463690.09 0.03 每次转换费用10.964.6984720.17 1.75 无效点击0.0547430.03234910.12 0.00注:优化上限和优化下限保留两位小数解出来的优化上限和优化下限就是使得google广告收益最大化时候,7种因素应该控制的范围。 六、模型评价与推广模型的优点:1、 主成分分析法集中了原始变量的大部分信息,通过计算综合主成分函数得分,对客观经济现象进行了科学评价!2、 模型的结果是以方程的形式给出来的,简介明了,且模型原理简

25、单易懂,便于推广用于现实生活中。3、用matlab计算最大特征根及对应的特征向量,和spss处理数据加快了计算速度,处理速度,减少了计算量;模型的缺点:1、 因为矩阵经过标准化处理,可能在处理过程中精度没有达到最高,在这方面还需要改进。 2、在考虑影响广告收益因素时,只考虑了其中的一些方面,有一定的局限性,导致了精确度不是太高。模型的推广本文中给出的评价标准总体比较合理,但判定指标有限,对其进行的正态缺乏论证。主成分分析对于广告收益问题准确而合理,不仅解决了各个因素对于收益的影响程度,也指导了公司应该如何更快的发展。但运用模型解决问题时,仅有每年的数据具有一定的局限性。 参考文献1 姜启源、谢

26、金星、叶俊(第三版),数学模型,北京:高等教育出版社,2003;2 汪晓银、周保平,数学建模与数学实验,北京:科学出版社,2010; 3 何晓群(第二版),多元统计分析,北京:中国人民大学出版社,2008;4.韩中庚,数学建模方法及其应用,北京:高等教育出版社,2005;附录程序1: a=0.38 0.015 4 5.56 0.038 10.18 0.0032;0.32 0.007 4 2.38 0.04 7.63 0.035;0.62 0.003 3.9 1.95 0.07 6.41 0.065;0.71 0.003 4 2.16 0.075 7.02 0.049;1.03 0.003 3.

27、6 3.34 0.06 12.60 0.055;1.24 0.007 3.7 8.55 0.068 13.14 0.067;1.04 0.004 3 3.97 0.053 19.74 0.109a = 0.3800 0.0150 4.0000 5.5600 0.0380 10.1800 0.0032 0.3200 0.0070 4.0000 2.3800 0.0400 7.6300 0.0350 0.6200 0.0030 3.9000 1.9500 0.0700 6.4100 0.0650 0.7100 0.0030 4.0000 2.1600 0.0750 7.0200 0.0490 1.

28、0300 0.0030 3.6000 3.3400 0.0600 12.6000 0.0550 1.2400 0.0070 3.7000 8.5500 0.0680 13.1400 0.0670 1.0400 0.0040 3.0000 3.9700 0.0530 19.7400 0.1090 cwstd(a)标准化后的矩阵为:ans = 0.0712 0.3571 0.1527 0.1992 0.0941 0.1327 0.0084 0.0599 0.1667 0.1527 0.0853 0.0990 0.0995 0.0913 0.1161 0.0714 0.1489 0.0699 0.1

29、733 0.0836 0.1696 0.1330 0.0714 0.1527 0.0774 0.1856 0.0915 0.1279 0.1929 0.0714 0.1374 0.1197 0.1485 0.1642 0.1435 0.2322 0.1667 0.1412 0.3063 0.1683 0.1713 0.1748 0.1948 0.0952 0.1145 0.1422 0.1312 0.2573 0.2844 cwfac(a)相关系数矩阵:std = 1.0000 -0.4546 -0.6670 0.4987 0.5485 0.6601 0.7073 -0.4546 1.0000 0.3357 0.4944 -0.7079 -0.0422 -0.7023 -0.6670 0.3357 1.0000 -0.1713 -0.0161 -0.9377 -0.8349 0.4987 0.4944 -0.1713 1.0000 -0.0653 0.4384 -0.0107 0.5485 -0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论