突破与重构:大数据时代的计算广告学研究_第1页
突破与重构:大数据时代的计算广告学研究_第2页
突破与重构:大数据时代的计算广告学研究_第3页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

突破与重构:大数据时代的计算广告学研究内容摘要:计算广告学是大数据与大数据技术在广告学研究领域的运用。在计算社会科学视域下,检视计算广告学提出的背景及传统广告学研究存在的局限,探寻计算广告与计算广告学研究之间存在的差别,并在这里基础上重点分析计算广告学作为一种新的广告学研究范式将在市场与消费者洞察、复杂变量的综合考量、宏观发现等方面实现对传统广告学研究的突破,以及对广告学研究新质的形构。计算广告学在发展经过中,遭受到了技术门槛、数据垄断、数据黑箱与数据隐私等多重障碍,但其发展具有不可逆转性。本文关键词语:大数据;计算技术;计算社会科学;计算广告学;研究范式计算广告学是大数据时代广告学研究的前沿性话题。自2008年“计算广告〞的概念提出以来,计算广告学的相关研究一直围绕广告的计算运用而展开,并未获得其他突破性进展,以至连很多基础性建构都尚付阙如。本文力图回答下面几个重要问题:计算广告学提出的重大背景是什么?计算广告与计算广告学差别何在?计算广告学研究包括哪些主要内容?计算广告学将对广告学研究产生如何的影响?其发展又面临哪些重大障碍?一、大数据时代的计算社会科学大数据与大数据技术已深深嵌入社会生活的各个领域,不仅“成为主要的生产要素〞[1],“变更我们的生活、工作和思维〞[2],同时也对人类的科学研究与科学发现产生重大影响。2006年,有名的计算机科学家吉姆·格雷(JimGray)在总结大数据促进人类科学研究发展时,提出“数据密集型科学发现〞(Data-intensiveScientificDiscovery)的概念,并以为这是人类科学研究继实验、理论与计算机仿真三种研究范式之后,所产生的第四种研究范式。所谓“数据密集型科学发现〞,即利用大数据与大数据技术,通过对海量数据的计算与分析,来发掘数据所潜藏的科学价值。“数据密集〞以及“数据计算与发掘〞是这一范式的典型特征。格雷的总结是针对天然科学而言的。在进入大数据时代之后,天然科学的众多领域,皆尝试运用已积累下的宏大规模的科学研究数据,并在深切进入的数据发掘中,获得众多有价值的科学发现。近十年来,天然科学研究已进入“数据密集型科学发现〞的研究新阶段。自近代以来,追步天然科学的研究方法与研究范式以探寻复杂社会发展示象与规律,一直是社会科学从未止息的学术努力。就在格雷提出“数据密集型科学发现〞研究范式后三年的2009年,以拉泽尔(Lazer)为代表的来自哈fo大学、麻省理工学院的15位美国学者,在学术期刊〔科学〕杂志上发表联合署名文章,正式提出“计算社会科学〞(computationalsocialscience)的概念。2012年,由意大利学者领衔,来自欧美国家的14位学者,又在〔欧洲物理学刊〕上联名发表〔计算社会科学宣言〕,全面阐释大数据计算方法对社会科学的影响及其发展前景,并宣告“计算社会科学〞的正式确立。计算社会科学的相关研究自此展开。2014年,〔计算经济学手册〕第三卷出版,将经济学研究从“计量〞“计算机计算〞推进到大数据计算与大数据发现。也是在2014年,来自哈fo大学等美国名校的近百名学者集聚斯坦福大学,举行名为“新计算社会学〞的学术研讨,并有17名学者在会上报告了他们在计算社会学领域的最新研究结果。进而将社会学正式纳入大数据计算与大数据发现的研究框架之中[3]。2016年,lAlvarez编辑出版的〔计算社会科学:发现与预测〕则对2009年以来计算社会科学研究状态进行了全面总结与回首,并对计算社会科学的发展前景进行了科学预测[4]。除此之外,计算政治学、计算法学、计算新闻学、计算传播学,以至还有计算犯罪学等概念都相继被提出,并在计算社会科学概念框架下先后开启相关研究。计算社会科学的相关研究,实际上是大数据与大数据技术在社会科学领域的研究运用。它基于社会科学研究对新的研究方法不断探寻求索与寻求的强大内在驱动,得益于天然科学“数据密集型科学发现〞范式的影响与启迪,具体表现出出大数据时代社会科学研究的总体发展趋向。二、计算广告与广告的计算运用2008年,“计算广告〞的概念在美国被提出。时任雅虎研究院资深研究员的AndreiZBroder及其研究团队,率先开展有关计算广告的研究。其研究迅速影响到全美,并很快涉及欧洲乃至亚洲。所谓“计算广告〞,其最初的定义,就是运用大数据计算技术,为特定场景下的特定用户寻找到一个合格的广告,以实现语境、广告和用户三者的最优匹配[5]。从“计算社会科学〞概念的问世到“计算广告〞概念的提出,其间仅相隔两年(2006—2008)的时间。“计算广告〞的提出能否直承受到“计算社会科学〞的启发和影响尚不得而知,但二者的思维取向却是一致的,都是科学家们追随大数据及其计算技术在各自相关研究领域有效运用的结果。大数据计算技术已经成为我们这个时代通用技术体系的核心技术,“社会计算化〞与“计算社会化〞逐步成为一种普遍的社会现象[6]。社会能够被计算,“计算社会科学〞因此得以发生。广告可以以被计算,因此催生出“计算广告〞。“计算社会科学〞与“计算广告〞,其核心内容都在于“计算〞,都在于大数据计算技术的有效运用,只是二者在面对不同研究对象和研究问题时,“计算〞的理路、方法,包含所使用的工具有所差异不同。计算广告的概念提出后,其研究大体沿着两个方向向前发展:一是围绕计算广告所展开的科学研究,一是计算广告的技术开发与理论应用。美国计算广告的相关研究,从如今能检索到的相关研究文献来看,大多采用技术性研究取向,并集中在计算机科学、信息科学与数据科学等天然科学领域里展开,其核心内容就是为实现语境、广告、用户三者之间的最优匹配,寻找技术路线,提供技术解决方案。重要牵涉计算广告的信息检索技术、定向技术、文本分类与发掘技术,尤其是基于大数据计算的各种算法,以至包含情感计算与语言计算,以及这些技术和算法在广告搜索排名与实时竞价、广告目的人群定向、广告个性化推送,以及广告的程序化交易等方面的运用。欧洲学者也大体沿袭了这一研究思路与取向。以“计算广告〞为本文关键词语,在CNKI中搜索,共获得2011年至2019年这9年间相关研究文献47篇,其中有36篇是计算广告的技术性研究论文。也就是说,国内外计算广告的相关研究,至今大体上仍在天然科学研究框架中展开,其并未被真正纳入计算社会科学的研究范畴。中国有少量社会科学视域下的计算广告研究,所采用的也只是传统意义上的社会科学研究思路与方法,所以,这些研究不能算真正意义上的计算社会科学研究范式下的计算广告学研究。计算广告的技术开发与理论应用,其整体水平要远远超越上述有关计算广告的科学研究。计算广告的技术开发与理论应用,集中在互联网领域,最初的发展,重要围绕实现语境、广告、用户三者的最佳匹配,也就是广告人一直苦苦追随而又一直没有能寻找到合理解决方案的广告精准投放问题而展开。基于信息检索技术的搜索引擎广告,基于用户数据分析与发掘的定向广告和个性化推荐广告,就是最早出现的计算广告的几种重要类型。计算广告其后的发展,无论是国外还是国内,都已大大超越早期计算广告的概念框架与范畴。大数据与大数据计算技术,不仅被用来解决广告的精准投放问题,也被用来解决基于即时数据分析与处理的广告效果的跟踪监测与广告投放策略的动态调整问题,还被用来解决包含精准投放在内的广告程序化交易问题,以至还被尝试用来解决基于各类复杂算法的策划创意等智能化内容生产的问题①。基于大数据计算技术的机器智能,正逐步替代人工去处理广告业务中几乎全部复杂运算和自动化程序[7]。计算广告的技术开发与理论运用,带来广告运作形态与运作方式的颠覆性改变,更造成广告产业发展的革命性变迁[8]。但从知识生产的角度来考察,其技术开发结果,只是以一种实际应用的方式呈现,其计算的思路与经过,一般都被尘封在“技术黑箱〞之中[9][10]。由于其商业属性,其结果更是不可能被共享。在社会科学各学科领域,广告对大数据计算技术的反应,是敏感而迅速的,大数据技术对广告的嵌入,也是颇为深切进入的。但是这种反应与嵌入,至今仍仅限于广告的实际业务运作的应用,还远未上升到学理建构的层面。从科学知识生产与学科建构的维度来加以审视,计算广告学的研究内涵,似乎比现有的计算广告的相关研究更为丰富。大数据时代的广告学研究,急迫呼唤从计算广告研究进一步走向计算社会科学视域下的计算广告学研究。三、计算广告学与广告学研究新质的形构所谓计算广告学,是以大数据时代的计算广告为研究对象的。有关计算广告的相关研究,都属于计算广告学的研究范畴,都是计算广告学研究不可或缺的主要构成部分。在计算社会科学视域下,对计算广告学进行理论与理论的双重审视,其丰富内涵确实远非现有的计算广告研究所能涵盖。计算广告学研究并不动摇传统广告学的基本研究框架,只是借助与广告学研究相关的新的计算技术、新的计算工具、新的计算手段,以克制传统广告学研究存在的各种缺陷与障碍,提升广告学研究的科学性与有效性。从这个意义上看,所谓计算广告学,并不是新的广告理论主张,不是新的广告理论流派,更不是新的广告理论体系,而是一种新的广告学研究范式,一种新的广告学研究的方法论体系。作为一种新的广告学研究范式,它将对传统广告学研究产生重大影响,至少在三个主要方面引发广告学研究的重大改变,这就是基于大数据与大数据技术的市场与消费者洞察,影响广告效果复杂变量的综合考量,以及广揭发展演进规律的宏观发现,进而带来广告学研究从应用层面到基础理论层面的全面创新。(一)市场与消费者洞察市场与消费者洞察,是广告学研究的基础,也是广告实务运作的前提。传统广告学研究中的市场与消费者洞察,都是以抽样调查的方式进行的。受数据收集技术与成本的多重限制,其数据收集通常是以特定时空范围的小数据、小样本为特征的。这就不仅存在数据量的限制,也存在数据空间范围与时间范围的限制。其数据收集,免不了调查者的“观察浸透〞,免不了调查者对被调查者的外在干扰[11],以至免不了被调核对象因个人偏好、记忆误差或者语言使用习惯等因素所导致的自我报告的偏差[12][13],进而严重影响到其数据的客观真实性。而且,市场与消费永远处于动态的变化之中,而传统广告学对市场与消费的分析却往往限于静态的考量,或者只是已经发生之事的事后检验,实时数据的采集与实时问题的研究,动态数据收集与动态跟踪研究,一直是传统广告学研究的久长之困。在传统的广告学研究中,市场与消费者的真正洞察,也许只是广告人与广告研究者一种连续追随却又一直没有能真正实现的美妙愿景。大数据发现的研究范式,使广告学研究中真正意义上的市场与消费者洞察成为可能。首先,大数据为广告学研究中的市场与消费者洞察提供了海量数据基础。不管我们怎样解读大数据,体量之宏大无疑是其最典型的特征。互联网与物联网上的各种平台,以及各类传感器与移动终端,已经留下并正在连续记录数以十亿计的消费者的消费“萍踪〞,成为我们洞察市场与消费者的数据基础。虽然在市场与消费者洞察中所使用的数据,很难称为“全样本〞与“总体数据〞,也同样或多或少存在某种数据的“缺失〞和“代表性误差〞[14],但其在数据的充足性、整体性和系统性上,却是传统广告学研究所使用的有限数据不可比较的。这就为克制传统广告学研究因数据匮乏与数据局限所造成的孤立化、碎片化与片面化的认知局限,为形构系统化、整体化的研究新质,提供了需要的数据基础与前提。其次,大数据为广告学研究中的市场与消费者洞察提供了客观性的数据基础。互联网上留下的各种消费“萍踪〞,被记录下的各类消费“数据〞,反映的是消费者的安闲行为,往往被视为一种“自提供〞和“天然数据〞[15],其数据收集的自动化程序,又避免了众多外在的人为干扰。诚然,大数据的数据生成与收集,也很难保证做到绝对的“价值中立〞[16],其间也同样存在数据的“形塑〞问题[17],但其天然性却使得广告学研究中数据收集的主观性参与问题得以缓解,进而大大提升了数据的客观性质量与效度,使得过度的偏态性研究得以有效躲避。再次,基于大数据电子踪影技术的实时数据收集,以及这些数据沿时间线不断积累所构成的长时间序列,为广告学研究的市场与消费者洞察,提供了即时与动态的数据基础,使传统研究中的时效性问题、静态性问题得以有效解决,进而极大提升广告学研究的预测性与动态性分析能力。(二)影响广告效果各种复杂变量的综合考察广告效果以及影响广告效果的各种变量因素的研究与考量,一直是广告学研究的核心问题。以美国为代表的定量与实证的广告学研究的主流范式,一直以来都是集中围绕此问题展开。然而,这一传统的广告学研究范式,同样没有能解脱方法论的窘境。严格地讲,在这一主导范式下所建立的各种测量模型,所设计的各种变量,均不足以反映复杂的市场现象和复杂的消费现象,不足以用来外推广告传播的复杂因果关系。由于它突出强调的往往只是单一自变量对因变量的重要作用,重点出力的往往只是影响广告效果的主效应分析,其所测量的因果关系,条件往往只是必须的却是非充足的,其结果往往只是可能的而非绝对的。基于复杂变量共同作用的社会事实,研究需要测量的应当是复杂多变量以及复杂多变量间的复杂关系,而这却大大超越传统定量研究方法测量与分析的能力范围[10]。而大数据的数据发掘技术,则能够系统综合分析作用于因变量的复杂自变量,以及这些复杂变量之间的交互关系。在对变量之间关系进行检测时,数据发掘技术还能够对所有变量间的交互关系进行自动测量,然后报告其中需要十分留意的交互关系。传通通计模型,更多关注的是变量之间的线性关系,数据发掘则能更多解读自变量与因变量之间的非线性关系,并通过可视化工具,来描绘叙述和呈现变量之间的这种复杂的非线性关系[10]。这在社会学与经济学的相关研究中已经得到越来越多的使用。虽然在广告学的科学研究中,至今尚未见相应的尝试,但在广告实际运作中所谋务实现的情境、用户与广告三者的最优匹配,就是基于这种数据发掘技术对各种复杂变量及其互相间复杂关系综合分析考量的结果。应该说,大数据发现的研究范式,使得广告学研究中综合性整体性考察复杂变量以及复杂变量间的复杂关系,不仅成为一种可能,而且正逐步成为一种现实。(三)广揭发展演进规律等基础理论的宏观发现广告学量化与实证研究范式的另一重大缺陷,就是用“小数据〞来证明“逻辑〞,用“小样本〞来演绎“大定律〞,在传统研究中,研究者老是力图用“小数据〞“小样本〞来外推复杂的市场因果关系,用有限数据来阐释复杂市场与消费环境下的宏观涌现问题。用力甚勤,发现却甚微。究其竟,是由于有限数据及有限经历体验材料与宏大理论论证间,存在严重冲突,存在难以逾越的宏大鸿沟[18][19],在量化与实证研究范式主导下,广告学研究的各种发现,能够是特定状态下的特定考量,却很难用来论证普遍显示规律;能够是微观层面的精细测量,却难以用来通达宏观;能够是已经知道与经历体验的检验,却不消来发现未知与预测将来。广告学是一门侧重应用的学科,重大的理论发现一直相对匮乏。上70年代之前,尚有奥格威的品牌形象理论,以及莱斯和屈特的定位理论可引以为傲,但在量化与实证研究成为主导范式的70年代之后[20],除整合营销传播之外②,似乎再也没有什么能够被提及的重大理论发现。大数据发现的研究范式,以其超大规模和超时空跨度的数据,极大扩展了人类的经历体验范畴,填平着宏大理论与实证经历体验之间的鸿沟,同时以其数据发掘中全景式的相关性扫描和全新的相关性涌现的优势,为广告学研究的宏观洞察和重大理论的提炼与发展提供了可能[12][19]。天然科学领域的相关研究,以及计算社会科学领域的社会学与经济学研究,已经提供众多有价值可参照的研究范例。总的来看,大数据发现的研究范式,既可用来解决广告应用层面的一应问题,又可用来展开广告基础理论层面的重大问题的研究。在研究思路与研究方法上,既可对传统研究方法顶用于定量研究的“数值型数据〞展开定性研究,又可对传统研究方法中只能用于定性分析的字符、图形、音频、视频等“非数值型数据〞进行定量分析[10];既可用新的数据与材料来验证已有的理论,可以从新的经历体验事实中总结归纳出新的定律[19]。基于大数据与大数据技术的计算广告学研究,对于广告学研究来说,具有着突破传统研究局限、形构研究新质的范式革命的重大意义。四、计算广告学发展面临的重要问题与障碍大数据时代,人与社会系统所需要的生存与发展技能,凸显为人的信息处理能力[21]。有学者将大数据时代的信息处理,概括为“社会的信息处理计算范式〞(Informationprocessingcomputationalparadigmofsociety)[22]。所谓“社会的信息处理计算范式〞,意指大数据时代运用计算技术来采集与分析数据信息,已经被人们公以为社会中最为主要的事项或行为方式[3]。而“社会科学计算范式〞(computationalparadigmofsocialscience),恰是“社会的信息处理范式〞带来的必定结果[23],已成为我们这个时代社会科学研究的一种主导范式。计算广告学带来广告学研究范式从传统计量走向大数据计算,其整体趋势已不可逆转。但是,科学研究中的范式转换与范式革命却充斥困难。计算广告学研究的发展,同样面临很多重大现实问题与障碍。(一)技术面向与技术门槛计算广告学是大数据与大数据技术在广告学研究领域的应用,其显著的技术性面向,造成其有较高的技术门槛,以及对跨学科研究人才与跨学科合作研究的强烈需求。从某种意义上讲,计算广告学的研究,必需以学科穿插与融合的方式能力真正得以实现。然而,传统的文理分隔与专业分化的教育制度与研究机制,既不能知足计算广告学对学科交融综合性研究人才培养的需求,又不能支持计算广告学学科穿插的研究合作。正由于如此,计算广告学研究至今仍呈学科分离的状况。在计算机科学、数据科学与信息科学领域的计算广告学研究,重点采用的是技术性的研究面向。而广告学领域的计算广告学研究,由于过高技术门槛的限制,绝大多数研究者仍彷徨在传统广告学研究与计算广告学研究的边沿地带。能够说,范围内,完好意义上的社会科学研究与计算技术研究双重穿插面向的跨学科的计算广告学研究,至今并未真正充足展开。(二)数据垄断与数据孤岛基于大数据发现研究范式的计算广告学研究,其基础与前提就是数据。若无真正意义上的大数据,也就不会有真正意义上的大数据发现。通观迄今为止的计算广告学研究,无论是西方还是我们国家,虽号称大数据计算,实则还是一种以“小数据〞和零散数据为基础的研究。这种研究,仍有可能导致“片面经历体验图景〞,以及“孤立化〞“碎片化〞的认知局限。造成这种状态的一个主要原因,就在于数据的垄断等因素所导致的数据可及性限制。在互联网各类数据平台上留存的以及连续不断生成的海量数据,基本上都把握和控制在大型互联网企业这些平台拥有者手中。假如说平台上流动的即时数据应用者与研究者尚可触及的话,留存的既往数据往往会被平台拥有者进行处理存储起来,应用者与研究者根本不可能触碰到。而且,在这些数据源中,可供规范分析与研究的构造化数据还是极少数,绝大部分都处于一种非构造化的离散型状况。而收集、传输、存储和处理这些体量宏大的离散型数据的技术,当前也只要少数的大型互联网企业以及大型的通信公司和数据公司才把握和拥有。即便那些数据源对应用者与研究者开放,由于技术的限制,仍然存在一个数据可及性问题。数据平台的拥有,以及数据收集、传输、存储与处理的技术强权,直接导致数据拥有的霸权与垄断,并在这里基础上构成一个个相互独立、互相隔绝的“数据孤岛〞。“数据孤岛〞的构成,不仅极大减弱数据没有能互相联通的数据价值,也愈加强化了使用者的数据不可及性。数据垄断与数据孤岛所带来的数据可及性问题,是各领域大数据运用面临的普遍问题,也是计算广告学研究面临的又一重大障碍。(三)数据计算与数据黑箱人工智能的发展,促使人类的知识生产不断走向智能化与自动化[18]。许多事情我们都交由机器去处理,这给人类的知识生产提供了极大方便。但是,机器的各种计算都是一个高度封闭的经过[6],其数据处理方法“被封装成函数、程序包、软件等〞[9],我们仅仅知道数据处理之后的结果,却不清楚其经过。以至连研究者也“不清楚计算机算法详细是怎样生成数据信息以及怎样对数据进行处理的〞[24]。他们无从对其数据处理的方法进行全面的评估,也无从通过经历体验证据和理论框架对其中一些复杂的互相关系进行解释[10]。数据与结论之间的数据处理与分析的经过与方法,便成了一个“数据黑箱〞[9]。人工智能越发展,数据处理的“黑箱化〞就越发加剧。这种状态在计算广告研究中具体表现出得尤其显著。然而,科学研究却不仅要“知其然〞,更要“知其所以然〞。既要检验大数据分析所得结论的可靠性,又要为大数据分析的经过与结果提供合理的解释,研究者需要翻开数据处理方法与经过的“黑箱〞,寻找到数据、方法与结论之

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论