宣明栋·数据思维课_第1页
宣明栋·数据思维课_第2页
宣明栋·数据思维课_第3页
宣明栋·数据思维课_第4页
宣明栋·数据思维课_第5页
已阅读5页,还剩713页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

I 1 1 110 114 115 132 137 157 158 159 161 163 175 186 187 188 189 191 199 218 221 237 237 V 263 264 265 267 277 279 280 282 294 294 312 318 331 342 1你好,欢迎来到数据思维课。我是宣明栋。即使你不是一个直接跟数字打交道的人,那么我猜,这几年你也会有数据我们现在妥妥的已经进入了数据时代。所有一流的互联网公司,无一例外的都强调自己的数据能力;而所有一流的传统企业,无一例外,现在最重要的战略就是数字化转型。各种刷屏文章里,跟数据有关的新词层出不穷,最新一波开始说数字原生、通用AI、机器认知等等了,统统不明觉厉。这种焦虑之下,我听说很多家庭主妇都报名去上Python培训班了。其实,对于普通人来说,大可不必,比学习数据知识和技能更重要的,是拥有数据思维。我为什么敢这么说呢?给你讲个故事:如果你的文学品味到了一定的级别,你看《红楼梦》后40回,即使不像张爱玲那样完全读不下去,也能知道和前80回不是一个人写的,水平完全不在一个档次。2但是,上世纪八十年代,有一个美国研究者发表了一篇论文,用统计学的方法得出结论,120回的《红楼梦》就是一个人写的。听上去很厉害是不但当时,中国国内有个数学系的大学生叫陈大康,读了论文原文,“发现有几个要害处难以令人信服,其中包括母体与样本的设定,以及统计时只从《红楼梦》中抽取了6万字,检验的指标也只有14个。”因此,他对结论非常不服。他并不是质疑计算机,而是对论文的研究设想和操作程序有不同看法[1]。接下来,陈大康就手工做统计。那时候是八十年代,做数据远远没有今天这样方便。72万字的红楼梦,他数了上百遍,获得了约2万个数据。最终得到的结论是,前80回和后40回语言风格有明显差异,作者肯定是两个人,而不是一个人。这下,我们这些有品味的红楼迷可以长舒一口气了。张爱玲九泉之下有知,也会发来贺电。从这个故事里,我得到了什么启发呢?有两点。第一,数据不会被观点打败,数据只能被数据打败。人家拿数据得出的结论,跟你的直觉再对不上,你心里再不服气,想反驳,也必须拿数据说话。3第二,比数据技术更重要的是拥有数据思维。要知道,大学生陈大康做研究,数据采集和处理全靠手动,那时候别说Python,连Excel都没发明出来呢,人家照样提出问题、解决问题。这才是一个真正懂数据的人。如果说陈大康手动研究《红楼梦》,还只是数据驱动学术研究的个案,相信今天你能感觉得到,数据在我们的工作和生活中,已经成了空气和水一样的存在。你是不是感觉到,手机地图估计你的行程时间越来越准;今年“双十一”,宝贝的送达时间越来越快;结婚登记之类要亲自到场的事项,越来越多地要通过App预约;提取公积金之类不需要亲自到场的事项,越来越多地可以线上自助……所有的业务都越来越有套路,所有的平台都越来越比你更懂你,所有的甲方都越来越要求你提供数据服务,而所有的老板也都要求你提供数据洞察。这样的时代,有数据思维,一切都是资源;没有数据思维,到处都是陷阱。身处数据时代,自由行走江湖的本领,必须包括数据思维。有了数据思维,就能提出问题,形成解决问题的思路,然后利用数据服务或者与数据专家合作,最终解决问题。但是,数据科学的知识非常庞大,很多技术非常前沿,普通人短期之内学不全,也学不会。所以,对于普通人来说,更重要的是你要有跟数据专家对话的能力。4说到此处,我必须再讲一个故事。这个故事可是亲历者告诉我的:故事的主人公是一个中国小女生,我们就叫她Helen吧。Helen入职了一家全球著名的互联网企业的中国办事处,岗位是人事招聘助理。工作了一段时间之后,Helen非常沮丧。她有KPI压力,要提供足够数量的合格应聘者,但是任务总完不成。难点在于,评价应聘者没有什么标准,这个面试官是这么认为,那个面试官是那么认为,把Helen夹在当中,到底听谁的呢?于是,Helen就找到人力主管抱怨。主管反问,你有什么解决方案吗?没想到Helen说,咱们公司每年有一万多人的招聘,每个应聘者平均有7个面试官面试,因此,每年就有7万条面试评价记录。这些年也积累了几十万条记录了。从这些记录当中不能做点什么,把评价标准化吗?主管说,好啊,我们找程序员哥哥去说一下吧。程序员哥哥真的就把问题给解决了,从此,Helen就过上了幸福的生活。Helen使用了什么数据挖掘的术语了吗?没有。Helen提出了什么模式识别之类的方法了吗?也没有。但是Helen生动地说明了我们这里的主题,普通人数据思维的精彩应用——提出问题,挖掘资源,开展协作,推动闭这就是数据思维。这才是数据时代最重要的能力。这才是在数据时代自由行走四方的通行证。5虽然数据思维如此重要,但市面上却没有称心满意的解决方案。绝大部分讲数据思维的课程都是给专门干数据的人的,讲的都是具体的数据技能,很少讲相关的认知。咱们普通人,反而被挡在了通往数据世界的门外。于是我主动请缨,来开发「得到」这门数据思维的通识课。做个自我介绍。我是宣明栋,得到品控的负责人。为什么我敢开发这门课呢?有这么几个理由:首先,我有数据相关的基本训练。我毕业于北京大学社会学系。如果你了解一点社会学就会知道,定量研究是这门学科最重要的研究方法,调查、抽样、概率、统计是我早在30多年前就学习使用的工作方法。1992年,我又去美国学习了一年社会人口学,包括当时最前沿的统计分析技术。那时候,天天泡在实验室,用SAS程序让大型机跑数据。数据量都是超亿级规模的,放在今天,也算大数据吧。不一样的是,当时计算结果都不能在实验室打印出来,要跑到挺远的学校主机房去取。另外,我的第一份长达8年的工作是在国家计生委做政策和法规研究。人口工作嘛,整天都会跟数据打交道。后来我去了中央电视台,做了很多年的电视节目。再后来,离开一线,去做管理工作。电视台的管理,最重要的就是收视率。这样,我又重新跟数据打起了交道。阅历上的积累,让我更深刻地理解了真实世界和数据世界的互动关系。6三十多年的学习和工作经验,让我有基础,有实践,还有阅历。你要是听过罗胖2018年的跨年演讲,还会知道,我就是那个“驯化抖音”的人。当然,那只是普通人与算法互动的游戏而已。对新事物,我保持着旺盛的学应该说,我不是专业干数据的,我最多的位置是站在决策者和数据分析师之间,所以,我天然就是站在你这一边的。我知道咱们普通人面对数据世界的困惑和难点,我也学习了数据分析师那一头的工作思路。而且,我会把搭建得到品控体系、开发一系列通识课程的心法用在这门课里。所以,说句不吹牛的话,我给自己订了个目标:不用公式和图表,在不讲具体的数据技能的前提下,帮更多人提高数据思维。课程里,我会从感知数据、收集数据、理解数据、操纵数据几个方面带你入门。以后人家再说变量、问卷、元数据、可视化之类的专业名词,相信你也完全能理解。如果你的工作会跟数据打交道,那这门课程能帮助你获得跟数据工作者对话的能力,下次看报表、提需求就心明眼亮了。当然,如果你是直接做数据工作的,我也建议你听听这门课。如何把你的数据技能跟真实世界的工作需求对接上,怎么跟数据小白解释你的工作原理和思路,这门课也能帮到你。7最后,还要感谢为课程内容把关的刘嘉老师,他是南京大学的计算机副教授,也是「得到」上《概率论》课程的主理人。当然,如果我这门课里出现了知识错误,是我负责,与刘老师无关。你要是发现了,请及时指出来,我及时改正。还记得商业评论家吴伯凡老师的棒喝吗——“在这个时代,你是要当算法,还是要当数据?ℽ如果你的答案是前者,那来吧,加入这门课程的学习,拿走一张进入数据世界的通行证。参考资料[1]案例来源于《荣国府里的经济帐》序,作者陈大康。9,(口………●●●如果有,我们把团购留在直播时候,说不定我就是家庭主妇报名上python●●●数据不会被观点打败,数据只能被数据打败。比数据技术rr●名州高速公路巡警被处以警告或者被勒令纪律反省。44名地方萨莉记者的数据技能是不够的,我猜她肯定不会Python,不会的是一组数据的集中情况......所以用平均值就不能反映数据的三个重要启发数据思维不同于数据知识和数据技能,数据思维是用数据提出问题和找到解决问题的办法。数据思维发挥作用,需要与其他能力组合。数据思维是对数据知识和数据技能的认知。rrr什么中国古人一直缺乏『量化思维』或许是小小的追求,泡面也能让你有比以前更好的生活体验由于工3027赞"我们对掌握的数据知识和技能形成一些认知,这些认知就是数一、对数据思维的三个误区1.与生俱来的数字感不是数据思维据思维是什么呢?数据思维是使用数据来提出问题和解决问题得到上的老师同学们都在说:不断提高认知!谢谢宣老师在本)?数据思维的范畴里,当一个问题运用数据思维能就能看到有描述清楚的任务、描述清楚的步骤这两块珍贵的“经量布局感测器,或许是重量感测、或许是大小形状的感测。在框架。不知道是不是可以套用学习时的“解题思路”这个概念。系统的思维模式。数据也同样是一个系真实性,然后再根据领导需求进行筛选。在工作中感觉公司对够好,希望在课程中能找到一份答案。期待后续课程~性”。布了2019年的数据,天津市离婚率最高,排名第一,达到了比例。”模式。这样,设计者就能找到一个对应值,在如何通过练习提高自己对数据的敏感度呢?教你三个方法——这个结果是可以明确量化的我们每个人的工作和生活,其实都的体现量化思维并不是要你做复杂、精准的事物,是一种降低认知负担的选择。但是随着社会的理性化越把自己的认知模式调整为量化认知模式就成了必须。这事物的那种感觉。<br/><br/>由于没能想到方法二的工作场景中的应用,故简单分享对于方法一和三的思考。<br/><br/>1.方法一:量转型<br/><br/>多次,要勤走动,关注客人的水杯里是否还有水。/><br/>1)目标是关注客人的水杯里是否还有足够的水。从目又能够达到公司盈利的基本面。<br/><br/><br/>听课后的能够找到操练的方法。跟同事们可以做“批判性思维”的工作坊,这样能够激发自己用数据思维代替主观的常识性思考。对数据有了情感不就复杂了嘛~~续性"的感知,不是有/没有、是/不是的二元区的诠释。那怎么做呢?欢迎到下一讲跟老师继续深化妳对感知用分越高表示这个人按时还款的概率越高。第结算、账务等与数字密切相关的工作或学习。可是在现在这个合条件,马上确认。我承认人类目前的运算速度,确实赶不上形中提高了我对数据思维“体感”的门槛儿…让我听懂这门课不费定量我们才能计算。这就是数学建模。那么通过什么指标来量什么,分子是什么。如果有对应值也要问下不放松,这么统计才有意义。相信很多同学都看过《奇特的一提高自己的效率也好。我知道我的这点实践是非常量定义、对应值<br/>目标:量化评价一份工作的好坏<br/>方案:关键量——月收入÷无附加值的工作时间<br/用一个简单粗暴的方式来形容一份工作的好坏,很容易能想到这节课让我突然想到一句话:“确认过眼神也不一定找到对的在那里,而观点是因人而异的。从数据思维的角度来说,但这是不是就说明中国的老龄化问题不严重呢?这就不是一个这就是著名的海底捞。两对夫妇分别是张勇夫妇大爱老师的课程,可以再多一些现实商业案例我从事的售额,但这个销售额定多少是合理的呢?我理解的有两点,一来的趋势发展良好,这家店的销售额综合增长率在20%~30%之感谢你对课程的肯定,很激励我。借你自面对的任务。我对开店不在行,所以没有能力回答你产生价值,同时也能更好的理解数据带来的商业产出。但不能是什么原因财务老师们『默认』数据应该是平稳的,任何变动找运营通常也会对比上年同期的数据和同行业其他公司数据做对比这样才能清晰的理解自己公司和本公司自己的预算做对比这个其实是为了让老板们知道年本超过预算,要找运营的老板聊一聊总之,单纯拿出一个数意……,这些比较级不同的词,在中文上会有程度深浅不一的感呈现幂律分布,即八零二零原理。从定性的感觉仝【1】理解数据,先定下边界得到大学的课程,都会先说“我是人的意志类似迪士尼用定量满意度问卷,测试的是“忠诚度”这个人为什么这样选这个边界/数据研究背景。仝【3】总结:应该是合格数据人的基本素养了~队的国家2.即使是巴西队这样的世界强队也仅战胜过中国队一中国队从未在世界杯点球大战中失利过6.中国队在领先的情况下从未丢过球7.还没有任何一直亚洲球队能够在世界杯上战胜中国队8.世界杯神奇定律跟中国同组的球队必是冠军或者季他们至今都没有机会与东方红魔交手11.没有一支球队能够在葡等中国队至今保持不败金身13.世界杯淘汰赛的点球大战中中国队完成恐怖的零失球14.中国队在世界杯上的丢球数远少【数据思维课第3讲如何通过寻找数据的背景来理解数据的类问题,也就是“是什么”问题,或者说是分类问题、定性问题。 举一个数据相对情况的案例。作为企业的一名商务人员,流。谢谢老师提供三个意志交流检验渠道,在驾驭数据为我们所用方面,非常具备实用价值。再自己练习一下么用在这儿说得过吗?什么如果没有用在这会怎样?那些是可能影响什么的因素?⋯可以让意志主题能现在自己的理解上对概—我们都是数据!科学家预测未来大数据将超过石油煤炭等,本人做过企业的质量体系的建设和达标以及企业的质量体系的于客户满意度的调查以及持续改进模块的理解总表总是成为一件不可名状的尴尬。听了宣老师所讲的“小目标”了。一个亿的小目标算不算小呢?放到富豪的背景工作。再多多尝试把这个框架应用到其他地方。是什分用户的生命周期,其实就是在定性网站站内流量的健康程提升用户价值,才会对唤醒沉睡用户。这波用户重新进入活r作年的目标。制定月经营指标时,不仅要看同期如讲的很实在,就像我们企业现实情况遇到的。财务部门总是只利润率。独立的财务指标数据是没有问题的,但是脱离了市场指导意义。我们佩服索普,科恩这样的将数据运用到极致的大留申群岛。如果你是作战的指挥官该听谁的呢?你可能会说,南京河西片区的房屋与江宁片区的房屋价差明显……;2、房屋眼睛。从数据思维的角度来看,不就是我们缺乏化。另外在做数据的结果计算中,若样本空间的选择也会导致结果发生很大的偏移。在网上经常看到某某的统老幼锻炼琢磨功夫的方法,例如:在学习就该好好锻炼数学、高手,或许更在乎知识间的连接和使用。借用罗胖的话:真正已知一个项目的平均管径是DN100,各种口径的管道总长是r认知。我们是不是可以认为这是一种认知上的迭代亦或是在不同视角下的观察所得,我们都是以这本能也不为过。只是在这探索过程中,不同的人追随了不同的估算。拆解以后,就可以参考产品生命周期来推断未来时间段你好,欢迎来到数据思维课。我是宣明栋。前面几讲,我们的重点都聚焦在数据本身,学习了通过数据的背景感知数据的意义,也学习了如何通过推理发现数据隐藏的信息。这一讲,我们继续感知数据这个主题,但是讨论的方向完全相反。先看一个广为流传的段子,就是寓言《半杯水的故事》。面对同样的半杯水,老耿可以快乐地欢呼:“太好了!还有半杯水可以喝!”小杨也可以沮丧地叹气:“惨了!只剩下半杯水了!”半杯水,就是一个杯子里有50%的水,面对同样一个数据,老耿和小杨的不同,来源不在50%这个数据本身,也不在前几讲说的数据的背景里,也不在这个数据是否在不同的关系当中。乐观还是悲观,来源于老耿和小杨内在人格的不同。对,差别在人那里。因此,这一讲我们要讨论的就是,如果从人的这一端来看,由于人的生物性和人与人之间的差异,就会导致我们对数据感知的不同。由于这个原因,提高数据的敏感度就有了人这一端的角度。那么,人这一端具体有哪些差异会导致我们对数据的感知不同呢?这一讲,我们介绍三个方向。方向一:人的生理倾向不同生理倾向,指的是人类的生物性因素。这些生物性因素有的来自生理结构,有的来自大脑特征,有的来自个体生理差异。这些就会导致,数据是一回事,人的感知是另一回事;或者数据是一回事,一部分人的感知与另一部分人的感知完全不组成了9个间隔。中间的间隔最大,这个很明显。现在问,其他8个间隔的宽度是一样的吗?看起来好像一样。但是用尺子一量,其实不一样,离中心越远的间隔越小。为什么这么设计呢?这其实源于人的视觉特点,会把远处的间隔自动调大一些。这样一来,原本离中心越远的间隔越小,但是在我们看起来,间隔反而是一致的,反而有了更统一的你看,由于人的生理结构的问题,本来不同的数据在我们的感知中却相同了。这个特点就被建筑设计师利用了。另一个很经典的问题是,认知心理学家发现:同样的数学结构的问题,如果包装成逻辑题,大部分人都会翻车;但是如果包装成社会题,很多人就能答出来。比如一个题目,先包装成逻辑题,说,“给你4张牌,你翻哪几张可以证实“如果纸牌正面的数字是偶数,那么背面的颜色就必须是红色”这个规则呢?你是不是也看懵了?同样数学结构的问题,如果包装成社会题,比如这么问,“如果规定借车的人还车的时候必须加满油,那么,“老赵借了车,老李没借,老孙没给车加油,老李给车加了油”这四种情况,问谁违反了规定呢?你肯定马上就能知道答案。其实,它跟刚才翻牌的问题本质上是一样的[1]。科学家解释说,这是因为人的大脑本来就是用来做社会题的。你看,同样的数学结构的问题,换个外壳,我们感知到的也完全不一样。另外,基因和发育过程也都会给人带来大脑特征上的差异。比如,有些人的空间知觉和旋转能力就特别好,有些人可以把挖掘机开得像绣花针一样,做拧瓶盖这样非常精细的操作,而另一些人就完全不行。这些差异可以拉一个长长的清单,这里不能一一列举。如果我们要建立数据思维,就要意识到这些差异,不要把自己的特点当成全人类的特点,大家对数据的感知可能不太一样。方向二:人的文化属性不同泛指因为历史、经济、社会等文化因素的不同而导致的群体性差异,表现为文化差异。这些差异就导致同样的数据在不同的群体那里有了不同的感知。我们看几个例子:给你一组全球经济增长数据。为了方便理解,这里用一些虚这是一个增长得越来越慢的趋势。现在问你,2021年的经济增长会是上升、下降还是保持原来的水平呢?答案取决于你问的是哪里的人。如果你问美国人,他们大概率会做出经济继续下降的预测。但是如果问中国人,他们大概率会做出经济转为上升趋势的预测。研究人员说,美国人更相信线性的发展路径,而中国人更相信物极必反的道理。你看,面对同一组数据,不同文化属性的人的感知是如此的我们再看另一个实验:调查员在街头请路过的人做调查问卷。不过,这仅仅是一个幌子,实验的设计其实在接下来的环节。为了感谢路人参与调查,调查员要送给他们一个小礼物。小礼物是铅笔,怎么给呢?就请路人自己挑选一支。注意,巧妙的设计来了。调查员拿出5支铅笔,4支是一个种颜色数量差异悬殊。那么,不同文化的人在挑选铅笔的时真的会。77%的美国人会选择数量少的那一种,也就是不同寻常的那个颜色,但是只有31%的亚洲人会选择数量少的那一面对4比1这样的数量组合,不同文化属性的人看法真的不方向三:人的价值立场不同斯皮尔伯格有一部电影,叫《间谍之桥》,其中有一意思的场景:两位律师见面谈判,一方是保险公司的律师,代表交通事故的肇事方,另一方代表受害方。受害方律师说:事实很清楚,你的客户在高速公路上撞了5个人,这是5件事,是5个意外伤害事故,所以你要分别赔而肇事方律师说:等等,不对,这怎么是5件事,这是一件事。我给你举个例子,如果我打保龄球打出了全中,一个球击倒了10只瓶子,这是一件事,不是10件事。我们跳出电影梳理一下。双方对同样的事实——一个人开车撞了5个人,产生了不同的认知。一方认为,不管受害方有几个人,都应该是一次事故。另一方认为,你开车撞的是5之所以出现这样的不同,在于双方的价值立场不同。一方认为责任事故赔偿要有上限,这也是保险公司的利益所在。另一方认为,争取每位受害者的最大利益是自己的责任。你看,价值立场不同,对同一件事的感知就不同。三个因素互相纠缠最后想提醒你的是,虽然上面分开讲了人在三个方向上的差异,但真实世界的挑战会来自上面三个因素的复杂纠缠,很举个例子:男性认为女性什么样的身材最有魅力呢?从生活经验、各种各样的广告和科学研究中,我们能得出一个大致相同的结论——男性喜欢低腰臀比的女性,也就是细腰肥臀、丰满大腿的类型。要是用对应值,男性最喜欢的腰臀比的数字是0.7左右。对于这样一个数据,大家的认知差异太大了。有的认为这是基因决定的,有的认为这是文化建构的,还有人认为这是男权社会歧视女性、物化女性的产物。0.7这个数据,虽然是事实,但只是一个单一的事实。如果多看一些事实,或许就会有不一样的感觉。比如,有人调查了天生失明的男性,让他们触摸各种体型的塑料人体模特,结果发现,这些天生失明的男性也更加偏爱低腰臀比的塑料模特。这意味着,男性对低腰臀比的偏好在完全没有视觉输入的情况下也同样出现了。知道了这个事实,你是更相信基因决定论,还是更相信文化建构论呢?再比如,研究发现:传统社会女性的平均腰臀比,要比现代西方女性的腰臀比更高。知道了这个数据,你是更相信基因决定论,还是更相信文化建构论呢?再比如,研究还发现,如果男性采取短期择偶策略,你可以粗略理解为喜欢拈花惹草吧,通常更喜欢搭讪低腰臀比的女性。知道了这个数据,你是更相信基因决定论,还是更相信当然,我们不能仅仅围着基因还是文化打转,还可以看看其他的视角,比如进化的视角。进化论理解腰臀比这件事,是遗传与环境的相互作用,而不是单一的基因作用。遗传与环境的相互作用,才导致了男性对腰臀比偏好的差异。注意,这里不是介绍哪种理论是正确的,我们只是说:面对同一个现实问题,面对同一个数据,生理属性、文化属性、价值观属性等各方面的差异都会导致我们感知到不同的东西,得到不同的结论。不了解这层意思,数据再多也很难为我所用,甚至数据反而会限制我们的进步。参考资料宣明栋下一讲,我们说说感知数据时的另一项重要能力——估算。我是宣明栋,我们下一讲见。左星星人和人之间存在差异,对数据的感受不同,这主要包括生理上的差异,成长的文化背景影响导致的差异,和价值观立场选择的差异我想到润总曾经提到的一个概念『时间颗粒度』,人和人之间的差异,体现在了『时间颗粒度』上,这也是衡量一个人职业化程度的概念而是『时间颗粒度』的差异,更多的是受工作环境,个人价值观取向和努力程度的影响2016年的时候,网络上曾经流传了一张王健林的行程表,显示了早上4点起床健身,当天飞行6000公里,出现在2个国家,3个城市,最终晚上7点回到办公室,继续加班王健林的行程表的活动的时间颗粒度是精确到了15分钟,比如和某某领导见面,参加某签约仪式等,一项接一项,容不得一点的耽搁英国电子邮报记者MaryRiddell曾经报道过,比尔盖茨的行程表是以5分钟作为时间颗粒度在现实生活中,我们常常因为一些朋友或者同事的不守时而困惑,最本质的原因或许是,你们俩的时间颗粒度不同,你的时间颗粒度是5分钟,他的时间颗粒度是半小时,那么你们的约会,他迟到了20分钟,在他看来,他并没有迟到啊如果一个人越成功,他的时间就越宝贵,那么自然而然,时间颗粒度会越来越小,我们应该审视一下自己的时间颗粒度,在安排约会和会议的时候,互相尊重彼此的时间颗粒度,这是职业化的表现猴子没有数据思维的人,往往习惯说“我感觉、我猜测、我觉得”异这样得出的结论往往没有事实依据。这样靠拍脑袋决定,而不是靠数据来支持决策,就导致:写了100篇文章也不知道什么类型的文章用户会喜欢;推广了10个付费渠道,却不知道钱花得有没有效果;上线了无数个产品功能,却不知道什么功能对用户更有价值。而正确的做法是,用数据去【客观】得出结论,做一个“有理有据”的人。donwe比如去医院体检,一个指标接近上限临界值,医生会觉得这个数据没有问题,因为他大概率会认为你的指标可能就是这出自己的身体需要注意注意,存在负面变化的趋势,进而得出需要加强运动,改善生活方式的结论。这就是面对同样的单次数据,不同角度的掌握不同信息,从而得出不同结论。余虎人与人的差异,也包括认知的上差异,这个差异导致期望不同,期望不同导致同一个数,你的比价对象不同,因此心理上的差异就自然而然。另外从另外一个维度看,若从函数的角度来看,如输入的一定的情况下,函数的规则不变,结果值一定是稳定的,若规则是变化的,结果一定有差异。在这个例子中,这个输入是我们说的同一个数,而生理差异,文化属性的差异,价值立场的差异,则是这个函数中的因子变最终感觉必然不相同。百陆BL我想可能还要包括一个专业差异。比如医生他在工作中见到了见惯见惯各种各样提示病情比较严重的报告单。举个例子,血常规白细胞能高到两三万的,但如果他见到一个血常规白细胞正常,只有炎症指标稍微高一点点的,就并不认为那是很严重的疾病,但这个报告单所有人看到报告单上有箭头的时候,就会非常的紧张。认知的不同就会引发态度的不同,就会引起误会或争执。十二月要早四和晚八老师今天课程引出,对数据解读除了要知道存在个体生理因觉得数据思维者只要好好运用想像力,就能把数据的力量,或说是解释能耐,有超展开的可能。我就想到一个孟加拉童话,是说一个农夫本来在田里唱歌,唱啊唱他的声音起初没啥特别引出,但再唱第二首歌的时候怎么有片羽毛掉在他嘴巴里面?估计是歌声音波震动让附近鸟儿飞了起来。他就把他唱歌多大声的变量告诉他的太太。他太太也逗趣地说:嗯!你的声音真是宏亮,把鸟儿都从嘴巴唱了出来。隔天太太去市场买菜的时候,跟买菜的三姑六婆聊天,也要描述农夫老公声音多宏亮的衡量,听到的邻居竟然大惊小怪,说那么大声呀!连鸟儿群都过来。接着邻居把这个告诉爱唱歌的闺蜜,希望她闺蜜也能锻炼一下多大的音量可以去找农夫发音比赛,目标是要让农夫嘴巴里面飞出更多鸟儿。接着他们去田里找农夫,希望农夫可以开口唱唱歌,他们准备去数看看到底有多少只会飞出来?兴致勃勃地期待下,农夫开口歌唱了⋯女人:怎么什么都没有?没半只鸟啊⋯农夫:啥?什么鸟儿?这个孟加拉BD故事给我的启发是,数据解释承载在人的认识和理解。这是个人之所以异于禽兽者的高级思维能力。虽然我们掌握数据思维是为了发现问题和解决问题,但是真实世界到底是什么?真相到底为何?真理是否存在呢?有些事情或许也不用刨根到底挖出个所以然⋯只要能把问题所引发的争议获得共情理解,或许当下看似问题,但是在不同时间或空间并不是问题呢!意思是,有些问题的出现,是存在共识取决于否而已,事情对错没有绝对。我们人类其实是一个需要意志和精神满足的物种,很多时候或许问题并不是问题,如果我们也能善用解释的能力,把原本以为是问题的问题变得不是问题,或许也是一种解决方案而已。谢谢宣老师今天的启发,我们就是要继续锻炼数据思维的驾驭能力。李奇亮【我的启发:数据和营销很像,都是千人千面】很巧啊,我昨晚刚看完了《间谍之桥》这部电影(斯皮尔伯格导演的片子很赞)本节课在说“数据感知”,那作为营销行业的我,也想补充2点内容:仝【1】发展心理学角度:不同的“数据感知方式”,是在说不同的“解释风格”就像半杯水这个事实,不同人的看法不同。背后是在说,不同人的知觉系统的不同,即“解释风格”的不同。而营销人很多时候,就是要解读不同人群的解释风格,然后进行洞察和策略落地仝【2】营销4.0:本课“生理、文化和价值观”视角,跟菲利普科特勒的营销4.0很像正巧,昨天刚在得到上看完营理论,说是在当前人和人高度连通的时代,影响消费者的主要渠道是三个1)营销渠道:企业释放给消费者的营销信号,不同甲方释放的不同,代表企业的特异性——跟本课的“生理属性”大致对应(2)他人渠道:主要就是社会群体对个人的影响,背后其实就是社会文化的影响——跟本课的“文化属性”对应3)个人渠道:主要说个人之前的生活经验/消费经历,影响其认知和判断——跟本课的“价值观属性”对应所以,由于至少这三个维度造成的感知不同,所以,营销是千人千面,数据也是千人千面姚美人为什么同样的数据感受不一祥?主要包含三个方面:一,人的生理倾向不同,二,人的文化属性不同,三,人的价值立场不同。现实工作中,大家经常会对同一个数据表现出不同的看法,也因此引起很多争议。为了让工作更加顺利的进行,我在想,有没有一种可能,让大家对同一个数据的看法尽量一致,人的生理和文化很难改变,是否可以从价值观的角度出发。比如,干销售的,对于销售额是好是坏的判断,我们根据量定义和对应值来统一看法,同比增长30%且环比增长10%,判断为好,同比增长0且环比增长0,判断为坏,在这两个条件中间的值,判断为一般。或者,不考虑同比环比,只考虑在商场同类品牌中销售排名,排名占前20%就是好,后30%就是坏。当然,判断的标准有很多,每个标准也会有不同的前提条件。我想要咨询的是,老师在把握得到品控的过程中,是取什么作为参考数据(纯属好奇假如大家对这些数据不认可时,您怎么解决呢面条请教老师,感性认识与理性认识的差异属于生理倾向差异还是文化属性差异,又或者是价值立场差异?似乎就是三种差异的复杂纠缠了吧?理性的人提出一个临终关怀话题,希望未来死在伴侣的怀里而不是自己孤零零躺在病床上死去,在理性人看来,这是一个双方约定达成的协商讨论,仅此而已。而感性的人听到这样的话题根本无法参与讨论,因为无法理性想象这样的存在画面,感性思维已经把客观场景的假定冲毁而陷入失去伴侣的悲恸之中不可自拔……RocHang本文所获数据,不局限于数字,生活中事情透露出的信息都是数据;不要以为同样的事情/数据所有人会一样的感受、观点,其实不然,因为生理、文化、价值观不同会交叉融合而导致差异;或许,这就是多元文化的魅力所在和包容性价值的意义!延迟决断差异性存在,歧视就不改。因为有了差异,就会有歧视,有了歧视就会有区别对待,区别对待就会产生稀缺。最终形成了大数定理和幂律分布;不管是进化论、基因遗传或文化建构论,都源自于人性的本能,也许三者就有混合因素;这就是黄金分割或九头身的女神受普罗大众喜爱的原因,女士对男生的审美也基本类同,有几个不喜欢高大威猛先生呢!哈胡锦利#学习数据思维课#面对同一个现实问题,面对同一个数据,生理属性、文化属性、价值观属性等各方面的差异都会导致我们感知到不同的东西,得到不同的结论。每月当经济利润报表出来的时候,投资人与店总对于数据就出现了认知感的不同。投资人想的是我应该挣多少钱?店总们想的是我挣了多少钱?人与人之间的差异会导致我们在面对同样数据时,产生不同的感觉,解释和观点,投资人看到数据报表时一个念头是"应该"挣多少钱,这个"应该"包括能耗费用为什么比上个月多了¥8000等等。店总们看到的报表时念头想的是,这样的大环境,这个月能有这么多利润还是很好的。这就同样的数据感受就非常不一样了。从价值立场解读数据,其实也可以理解为利益角度。人所在价值立场就是受益点,怎么受益就怎么解读和使用。我们在买基金时,经常看到基金的过去收益率数据,这很多时候成为购买基金的直接参考数据。实际情况呢,却复杂无比,基金规模、基金经理履历和风格、基金公司声誉和规模、过去市场情况、买入时点等等太多因素决定了你买的基金盈利情况。所以,全方位的数据量化转型和综合数据评估分析,极其重要。同时也让我们在面对数据营销攻势的时候,保持一份清醒,可以少被忽悠。宣老师的课开的很及时估算,你肯定不陌生,就是对事物的数量做大概估计或者推断。为单位表达时,选取固定数值299792458”。科学家是一帮严谨它说的是,你进行决策分析的花费应该约为1.对数据精度的过分迷恋是一件要警惕的事情。时有6分钟是在纽约的天空。因此任何时刻纽约上空平均有四分钟,结果会不一样,但是这没有关系,不影响面试的结果。算,得到的结果和前面一种方法估计的结果差不多。对于这种的话,那就要算面积了。我们都安长方形方呢?【如果北京人口加上外地来京工作的流动人口约为3000在投资上有句话,宁要模糊的准确,也不要精确的错误。在评谢谢明栋老师的分享,我这边想从另一个角度来讲,为什么要敢于不精确?我们在做营销转化时,知道,对于一个行业的用人的转化率是10%,同时也可以通过模型找到10%的群体的他们的是不明智的选择。总结:在营销时,并不是定位的人员越到中建投的星巴克研究报告报告内搜索单店产出、销售额,发最多的拿铁一杯,32块钱为标准,则每个月的咖啡销售倍数为约为博主估算数量的25%如果是这个数量级的误差,这种简单公里。。。这有多大,还是靠常识去还原,查了下深圳市面积估算个人理解是对不同目标做到心中有数花多少精力时间来发达地区的人比较注重效率,翻一倍,1/5,也北京一天消耗快餐盒面积=使用快餐盒总人口×使用快餐盒次数天2次外卖,一人一年共200×2=400次3.一个餐盒大概0.2×0.1=0.02㎡由此可得北京一天消耗快餐盒面积=600万上记录的,评估对交期的影响程度并结合1%法则明确是否要转确实际工作中达不到。还有一道题,特别有意思,是我高中刚看冠心病就要用CT,看心功能要用超声,检查心肌病上的伴奏?还是女儿的第一次演出?还是肖邦的亲自弹奏?不一节课上掉了,才算是我们的收入为了『映射』出哪个外教外教的基本工资是固定的,只要当月的工作量没有超过100小班费每个月结束,外教使用率排名拉出来一看,谁受欢迎,到员工的年龄和收入有没有关系啊?那就从表格中调出年龄变量和收入变量,计算一下这两个变量的相关系数,答案就有了。师也谢谢踊跃留言的同学们。谢谢谢谢试着回答一个问题到的数据用什么装起来?】收集到的数据用【变量】这种东西装起来。三层概念——数据、变量和种数据是向下兼容的。第二,明白数据的类型不同,数据处理的方法就不同。第三点,只有深刻理解数据类型的意义,才会充分地利用其中蕴含的信息。棒仅有25%的家长选择男婴。如果其他类似机构能够得出相同占平均性别吗?它还代表哪些信息呢?解答:(1+0+……+0)01这是我听过最有趣的数据处理类类比了,老师真是太有趣分别用唐僧(只能乖乖别乱想)、沙悟净、猪八戒、孙悟空各显神心的选择为啥以女婴受欢迎?会不会是现代人生活造成女婴偏多的原因?⋯⋯族繁不及备载的问题和相关分析也能开始进行管婴儿公司有了特定性别取向的技术6.政府应该对这类问题做长远规划,防止人口结构走向极端7.用这个数据和妇幼保健院习题:首先明确一下数据类型,性别是类别数据所以不能加减逆的。例如小明23岁,我们按照中国的年龄的分类标准15-师表达谢意,数据思维从专业角度讲其实很难向外行传的时候,尽量多收集比例数据,以后需要的话可以向下变换。”搜索之后,如下内容或可作为较好的补充来理解本小节。<br数据的中间级,用数字表示个体在某个有序状态中所处的位置,初中=3,高中=4,大学=5,硕士研究生=6,博士及其以上=7。有绝对零点,可以做加减运算,不能做乘除运算。例如始将重点放在以比例呈现数据(收集其背后是有理论依据在的~~数据进行差异化的方式(重女轻男)●过量子吗?看得见员工敬业度吗?抓得住现代化吗?这些东西地把握一个地方的营商环境到底怎么样。所以,我们需人文环境,说的就是文化传统、宗教信仰等对满意度的测量很可能是有效的;如果不相关,那就很可能无效。1、维度的分拆因人而异,每个人对于同一事物在维视角在扩展评价结构的同时也需要被框定在一定之后,企业需要根据工种岗位,对人员进行进一比较大,标准也随目的不一样而选取维度不同;维度选取的原要测量的指标。测量婚姻关系稳定性:1.未来生活目标,同时测量长时段生活目标改变2.当下生活事物分配状况以及各自收益操作中就体现了边际效用最大化原则,即少一个维度-意义大不167确定是如果不是如何??忽略小问题,开始学习总结感度的时候学习了将感性认知通过量转型的形式转化成可以衡量的量来度量。这节就是将怎么样来测量这个量。测量的原则。测量的值和我们的指标之间要有想关性、结构性和完备面发展来考核中小学生语数外是基础科目音乐劳动体育美术丰富了整个学习内容这些都满足了测量的关联性,怎么才能做到一个好的抽样呢?你记住一件事就行——样本要你要掌握的第一个知识点就出现了——只有概率样本才能确保这就是我们要掌握的第三个知识点——可以用非概率样本应对这就是我们要掌握的第四个知识点——抽样调查的结果是一个例在46.8%到51.2%之间”。访谈,怎么办?可以换样本吗?这时只能使用非概率抽样非概率抽样是指调查者根据自己的方便或主观判断抽取样本的方法定程度上说明总体的性质,特征,但不能从数量上推断总体非然后按照各层样本数与该层总体数成比例的原则上下功夫,只要找一些典型案例进行分析就够了滚雪球抽各种特征大体接近总体的特征的时候,样本就具有代表性。只使用概率样本。概率样本是指,每一个样本都要按照事先确定的概率规则选取。样本代表性,专指与研究目的相关的维度对是一个有限制条件的范围,而不是一个单一样结果直接用在总体上,真正的结果是一个带限制条件的范围。宿舍抽样的例子让我对随机抽样的理解更深了别大或者期间有金额期末却变成0的样本首先挑选出来进行单可以用非概率样本应对复杂情况。非概率样本最大的问样本的方式,概率样本?(说人话)就是样本的研究目地的维度的那样本量抽去多少呢?这个和总体样本量的大小以及置信度有关。那怎么样评估和计算呢?可以使用公式n=(z^2•s^2)/E^2的情况比较复杂,具体的情况具体决定,可以使用滚雪球抽样、样本的各个特征大体代表了总体的特征。(一种估算思维),样本农民认为京城里的皇帝用的是金锄头。从极小观察范围得出的抽样调查的方法小结总体原则:样本选取需要具有代表总体特要调查核心维度;抽样调查的数据结果:调查的数据结果都是首先是应用场景上,问卷已经扩散到了社会生活的各个角落。7.我感到体重减轻。①很少②有时③经常④持续20.我仍旧喜爱自己平时喜爱的东西。①很少②有时③经常④持续脂或者食物粘在上面的化学物质的炊具”吗?在回答“知道”);接问得道,很多时候需要“话术”在问卷上个场景之中。【问卷的含金量在概念的操作化】他们就用的含金量就在于概念操作化的水平。【问题标。按指标子及保证测量的完备性。2抽样调查是有一个限制条件的范围。2.必计的问卷必须让答题者正确理解,正确回答度。这也是高手与普通人的区别之一吧!第内行人才能体会到●还是饭后吃的……也就是说,你要保证干预人的贡献会不会提高呢?研究人员就选择了100名有杰吃了假药也变聪明了怎么办?要是实验者发真药的时候和发假加上一些技术参数的比较,记者得出“国产电饭煲胜过日本电饭着偏袒了一方,应该多尝试几种配比。第三,找了十个大爷大本地化的其他原料变量因素;这个实验如果要稍微观的评定规则。最后再比较结果,判定结果的依1.样本量不够,无论是电饭煲还是实验人数,所因变量,也就是你要测量什么来衡量自己干预或者处理的效果。所以实验室中发现的效应很多都是临时的,不能应用实验法通过操纵自变量、控制无关变量、观笨笨1.人数太少。2.不同年龄段人员口味可能在电饭煲和大米实验,实际自变量有电饭煲和大米两个。就我做出好的味道来。如果能把差的米做出好味道来,这才能证明电饭煲的功能吧●随便找。要是对象内部差异很大,又不能全部测量用样本来推断总体。如果想了解人的内部状态,就必须用问卷。朋友。如果一位同学长时间不与人沟通,那他就需要重点关这所学校找到了一个办法——观察一个同学的饭卡刷卡时间与如果你会使用数据爬虫,就可以抓取很多数据为你这个学校每年由于各种原因需要上报的事件总数也没有超过这个案例说明了数据污染的一个来源——生产数据的机构只管比如,支付宝的支付行为数据,数据量够大吧?但是横还有微信支付、银行卡支付、现金支付、数字货币等围纵向方面,支付宝的数据最多也才持续一二十年。这种我们能用支付宝的数据推断中国人整体的支付行为特征吗?显了一个很强的“暴露–反应关系”——抽烟越多的人,死于肺癌的的肺癌患病率是不明智的,但样本内的比较,也就是比较这笨笨人,就如例子中找到孤独的同学和贫困生。#数据思维#学习大数据到底有什么不同使用r但是现实中大量的事物都是不可见的,它的特征隐藏在可是用什么指标来表征呢?是日活吗?也就是每天都使用得到如果这个月正在一个大的上升周期当中呢?这一个月的上升本只有7%的话,那还应该优先安排冠心病相关的检查去表征冠心第二层问题其实更难——如果没有现成的变量能表征我们想要衡量一个新闻记者组的制片人的业务管理水平呢?这个用传统利用现有数据构造新指标带来的问题此前在宣老师的留言里数除以标准小时数,来计算这名老师受欢迎的程度这个例子『受欢迎程度』但是我们在使用这个指标时,也发现了存在多这些复杂的因素导致了学生对于不同科目的『底层需求』出更加受到固定资产投资的影响,而具体的“性价比”无从得知。方向。这个让我想到了贝叶斯定理,他的核心思想是:我们根的时候仍然会根据三个数据的误差进行调整4.gdp可调整范围别,对于数据变化明显的一定要注意。如果说一定要只用一个价值衡量,如果简单理解成单价*生产数量的话,反应了这个地现出来的。二,利用现有数据构造新指标有风险,那是疯子。从而从侧面说明:要想有新的突破,就用数据来给事物定性,就是表征。但是现实中事情真相往往是划分标准。这个标准就是定义一个变量和这于是,大数据专家指令宣传团队向这个地区密集发放竞选传单,我们打标签你的任何一个行为都有可能Tag化。你购买了任何这样的小标签通过大数据技术,互联网公司可以把每个客户的变成无数个越来越多的小标签,精准分类,持续推出爆品对比的影响。根据我们现有的经验,私立学校的升学率普遍高于公子。所以,我们不能单从升学率来评判学校教育水平的高还要结合实际情况来判断。再说一个我自己的故事,分类的结间去逛京城啊?●按照量的标准做区分,保证组内差异小,组间差异大。标甲的例子,回来的飞机机翼上伤痕累累,其他地方伤痕比较少,1有积累的数据可以用量衡量区分据就需要最最原始的,也就是用户通过行为自发生成的数据是#数据思维#学习分类:谁是他谁是我数据思维不但要与数r的数据,之前确实是靠经验、大概、堂食顾客访谈表(90%都是",惠活动,激发在此消费的意愿。这是数据给出好的 只有在数据和现实生活中见建立可靠的连接,才能用数据解大数据专家说的没错,行为数据就是比观点数据要真实和有用怎么判断、验证我们建立的连接是可靠的?如文中修道院案例。-组内方差之和/总方差,可用于衡量分类效果。使用基于样本是因为两性的身心差异?多大程度上是因为歧视呢?想知道这那么,这个共性部分的比例是多大呢?研究人员报告说,占了你赞同这个结论吗?可以先看看这个研究的数据收集和处理的是依照统计标准提取出来的,如何解释是一个者主观参与了。这就是很多人把因子分解方法称为“探索性的方分解的难点就在于,数据表明,妻子的受教育程度研究人员找到了一个巧妙的办法——看妻子的身高。他们认α收益和β收益关注过股票价格波动的同学应该能够观察到一个现象,股票价格倾向于同涨同跌,行情好的时候,大行情坏的时候,大家一起跌。在股票价格波动的背后,有一些不一样在基金业里面,你可以把贝塔收益看作是一种相对被动点,力争获得一个比市

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论