猎云网3月12日报道 (编译:Jasmine)
猎云网注:小伙伴们你们造么?只要你上了网,随时都可能成为数百项试验的小白鼠哦!是不是很恐怖的样子呢?但是科技是把双刃剑,通过不断地试验,机器人男友说不定都不是梦哦,想想就有点小激动呢!
小数据大作用 改变你我他
2013年,Monica Rogati接到了一通邀约电话,这是一家以便携式音箱和蓝牙耳机而闻名的公司,并且一直以来都只专注于这两样产品的开发。在此之前,Monica Rogati 已经创建了一家网络求职社交系 统,这套系统可以称得上是全球最智能的网络求职社交系统之一。她的代码可以从LinkedIn中筛选个人档案,神奇地把那些“你可能认识的人”推送到你面前。
那时候,著名的蓝牙耳机和扬声器厂家Jawbone,正在往健康跟踪业务领域发展,并且已经推出了一款叫做UP的智能腕带,用来监控佩戴者的行走步数和睡眠,由此获得了大量用户健康数据。之所以会电话邀约Monica Rogati,就是因为Jawbone希望有科学家和行为心理学家来对这些健康数据进行分析,从而有效利用。
这项研究引起了Rogati的兴趣,她欣然应允。随后,她对Jawbone提供的成千上万人的睡眠模式进行了仔细研究,很快某个些不同寻常的发现吸引了她的注意,“我发现……女性每晚睡眠时间平均要比男性多出21分钟,”她这样说道:“我当时就想,这怎么可能。”
Rogati迅速开始复核这些数据,但是每一次复核得出的都是同样的结果,于是她开始查阅学术文献。令人惊讶的是,大量的科学研究,包括那种在短时间内对300个左右试验对象进行追踪的有实践支撑的研究,都显示女性睡眠时间比男性多出大约……21分钟。Jawbone成千上万个数据得出的研究结果恰恰和这些几十年前的科学研究不谋而合。
但那些研究文献已经是历史了,而Rogati的研究才刚刚开始。她要做的不只是通过智能手机或是智能手环不断去追踪成千上万个人,然后证实那些她已经证实过的东西。她在想,我能不能做到实际影响人们的行为呢?不是去计算人们睡眠时间有多长,而是帮助那些女性还有睡眼惺忪的男性睡得更长呢?
于是就在去年,Rogati和Jawbone刚组建的数据科学家小组一起开展了一项试验,开始验证一个被称为“承诺原则(commitment principle)”的心理学术语。他们向4万用户发送信息,让他们选择参加活动,然后让他们自己定一个具体的时间,准时准点上床睡觉,这个时间当然要比他们之前习惯的时间早那么一点。试验的结果是:有三分之一的用户选择了参加试验,并且提前了睡觉时间,平均下来这些用户每人每晚早睡了23分钟。
这种试验确实有点“老大哥在看着你”(乔治·奥威尔的《1984》,老大哥象征着极权统治及其对公民无处不在的监控)的恐怖感觉,但是那些在算法驱动下采取行动的人们对此反而持赞赏态度。Jawbone声称90%的智能手环用户都表示他们的健康观念被愉快地刷新了。Jawbone创始人兼首席执行官Hosain Rahman在旧金山总部办公室里说道:“我们之所以能做到这一步,是因为我们在数据科学上投入了大笔资金。”
到目前为止,这项投资还远远不够,Jawbone很快会开始从用户手机中的其他应用中获取数据,比如Netflix,通过这些数据来尝试自动化劝导。比如说,建议用户在睡前观看《摩登家庭》,因为这会比观看《行尸走肉》首播多睡57分钟。
这种和用户的密切联系,一直很受重视。从20世纪50年代开始,消费者就一直在被追踪,被试验,被劝导进行某种行为。正如每一个《广告狂人》的观众都知道的那样,心理学就是现代广告产业的核心灵魂所在,象征意义、故弄玄虚和焦虑渴望第一次被当成了商业武器。现在随着像智能手机、可穿戴设备、温度调节装置、汽车这些联网设备的普及和发展,再加上各类软件应用功能愈发强大和集中,行为科学研究进入了一个黄金时代。数据将不再仅仅是反映我们是谁,它将开始帮助我们决定自己是谁。
Jawbone联合创始人兼首席执行官Hosain Rahman表示,通过不断的试验,他的健康追踪器正在帮助人们缩小着意志和行动之间的差距。
从理论到行动 豚鼠经济走上历史舞台
这个新兴领域有时候被称为“Captology”,这是“计算机劝导技术”的缩写,1996年斯坦福大学计算机科学家 B.J. Fogg创造了这个名词。这个技术给我们带来了一个更加强有力的术语:豚鼠经济(Guinea Pig Economy)。
目前在这一领域已经聚集了大量资金,据福布斯估计,风投资金加上早期试水的公司获得的回报,这一领域已经达到70亿美元的规模,并且这个数字还在不断飙升(目前全球排名前1万的网站,仅仅有不到20%在使用第三方工具对用户进行试验。)并且以上数据并没有算上数字化劝导带来的连锁反应,而伴随着试验的普及,这种连锁反应的规模也会成倍增加。
同样道德问题也不容忽视,从我们吃了什么看了什么,到我们的步伐、我们的脉搏包括我们的体温、室温,统统暴露在第三方面前。这些有的是我们知情并且同意的,但是更多的是在我们毫不知情的情况下进行的。
豚鼠经济的根源可以追溯到20世纪90年代,太阳微系统公司(Sun Micro-systems)研究员Jakob Nielsen发掘出了早期互联网浏览器作为试验平台的潜力。Nielsen帮助普及了这样一个概念:不是给每一个人都展示同样的东西,而是有针对性地给不同的访问者展示不同的界面,以判断哪一个更加有效。A/B测试由此诞生。
在世纪之交,Google开始把豚鼠经济这个概念落实为行动。这家搜索巨头在本世纪之初开始进行A/B测试,随机向数百万用户提供不同的搜索结果页面,有的附带10个链接,有的20个,还有的30个。结果证明,链接最少的页面加载速度最快,而精简链接之后飙升的加载速度则能够更好地留住用户。
Google的俩创始人都是理想主义者,员工也是,所以Google一直有一个“不作恶”的信条,正因如此,它把A/B测试融入到了经营理念当中。截至2008年,Google每年要进行6000次试验,根据试验结果进行超过450次搜索算法和界面布局的调整。Google 顶尖工程师黛安·唐(Diane Tang)表示:“我们的技术团队和数据科学团队通常一次就要进行几千次A/B测试,以通过各种不同的途径来提高我们的服务,从判断用户最喜欢的颜色和界面布局,到更高效地利用我们的基础设施。”
豚鼠经济理念目前已经成为搜索市场的核心主题。负责微软必应搜索引擎优化工作的Ronny Kohavi断言说,网站应该坚持对至少一半的访客进行测试,他这么说了,自己也这么做了:必应现在每天对用户进行300次测试,测试结果直接就可以转化成经济收益。2013年,必应就“是否应该在精选广告中包含一个以上的链接”这个问题进行了一次大规模测试,结果是:两个或者更多的链接比只有一个链接要好。而据公司透露,这个测试结果让公司年营收激增了1亿。拥有斯坦福大学博士学位,并在Amazon负责过测试工作的Kohavi对此表示,数据胜过直觉。Google的工程师们说话就犀利多了,他们把现在还在靠直觉办事的网站称为河马(HiPPO),或是“一把手的一言堂”。
Ronny Kohavi 负责微软的必应搜索引擎
从实践到结果 A/B测试成效卓著
平心而论,现在任何一个网站负责人都能够进行A/B测试了,Google、Adobe还有Mixpanel都在销售测试类工具,让一个初级的市场专员都能够对网站或是应用进行调整,改动产品的颜色或是界面,这是一个规模达到30亿的市场,并且市场规模还在不断扩大,市场研究机构TrustRadius的调查结果显示,使用商业软件的公司当中,有60%都计划投入更多资金购买A/B测试工具。
不过A/B测试的狂热宣传者却是一个娃娃脸的年轻人,名叫Dan Siroker,曾名列福布斯30位30岁以下杰出创业者名单。他创业公司Optimizely就是一家用A/B小测试赚大钱的公司,目前已融资8800万美元。2006年,Siroker刚刚23岁,在Google担任项目经理,当时公司让他提出一个产品创意,直呈给创始人拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)。同事们告诉Siroker,两位老大可是很挑剔的,说不定会铩羽而归哦。于是可怜的Siroker更是乱了方寸,这时候一个高管给了他一个明智的建议:“你只要去说,你想做个试验,就OK了。”于是果然就OK了。
2007年底,当时还是总统候选人的奥巴马来访了Google园区,Siroker当时就突然想到,Google为内部使用开发的随机测试工具完全可以在总统竞选中发挥作用。奥巴马也表示希望自己的竞选是建立在数据的基础上,Siroker接受了这个挑战,他速度搬去了芝加哥开始做竞选数据的分析工作。他对筹款人的邮件和网站进行了Google式的A/B测试,由此使得支持者的注册数量一下子增长了40%。通过试验,Siroker选出了24种各具特色的注册页面,又继续缩小选择范围,最终选出了最有效的一个注册页面,这么一个举措就让竞选团队多筹集了6000万美元。
如果留在政治圈,Siroker浅色系的头发和主播一样上镜的微笑一定会为他加分不少,但现在他成了试验运动的“传教士”。2009年,Siroker离开了奥巴马团队,和Google前雇员Pete Koomen一同创办了Optimizely。Optimizely是一家软件公司,提供网站调整和分析工具,这个工具正是奥巴马团队和Google都曾使用过的,操作非常简单,即便不是程序员也能够轻松通过拖放菜单,创建几十种字体、颜色、界面布局都不相同的页面,然后随机选择访客展示给他们。Siroker自豪地说:“我们最棒的那些客户,已经创建出了自己的测试文化。”Optimizely英国地区销售负责人Oren Cohen表示:“你可以对6.3万个人进行试验,他们不会知道自己成为了某个试验的一部分,也不会知道这些试验对他们行为的影响。”Optimizely 目前拥有超过8000客户,包括迪士尼、微软还有索尼,而它的总部位于旧金山市中心一个洞穴状的仓库里。Siroker声称他的测试工具平均能够帮助客户提高21%的在线营收,比如说美国百得公司(Black & Decker)旗下的得伟(DeWalt)品牌,对“现在购买”按钮进行了测试,最终发现“现在就买”的效果要好很多,仅这一项改动给该品牌增加了每年六位数的在线营收。
另外还有一些创业公司对Optimizely的产品做了进一步优化,以色列的大数据公司Commerce Sciences就明确了人们在访问网站的时候最关心的东西——信誉度、价格、综合人气等等,然后对症下药,满足人们的心理期待。其创始人Aviv Revach 对此这样解释:“踩准你痛点的东西,未必就能瘙到我的痒处。”
Optimizely首席执行官Dan Siroker表示:“我们最成功的那些客户,已经创建出了自己的测试文化。”
Optimizely首席执行官Dan Siroker
从网络到身边 物联网孕育希望
想要操纵网站访客的行为其实还是相当简单的,因为整个交易都是数字化的。但是我们现在正在进入一个剧变的时代,要把网络世界的A/B测试思维带到物质世界中来,数据和测试将会为物联网的到来提供有力的支撑,指引线下互联的实现进程。
在这个新兴的领域,Jawbone的Rahman无疑是个开拓先锋,早在2011年他就推出了一款智能腕带,不过这一次遭遇了失败,因为质量问题,他不得不全额退款。因此在不到两年前,他开始孤注一掷,把公司的生死压在了软件和数据上,首先他收购了一家分析公司Massive Health,并聘请了第一个数据科学家Abe Gong。紧接着又进行了一轮紧张招募,招揽了Rogati等数据专家。到2013年11月份,整个公司的试验模式万事俱备,于是提出了第一个假设:如果在感恩节告诉智能腕带用户,据统计,他们当天更可能会在沙发上度过,能不能激励他们更多地运动起来呢?Jawbone向5%的腕带用户发起了挑战,要求他们在当天走完特定的步数,接受挑战的用户在当天至少都多走了1500步。上一个感恩节里,Jawbone把试验推广到了全体腕带用户,他们向有些用户发送大标题,直接鼓励他们迈开腿,对其他一些用户则要委婉得多,只是给他们发送一个节日快乐的信息,字里行间则带着暗示,提醒他们要走完的步数。不过说到底,措辞并不重要,这个劝导本身就足以鼓励用户多走那么1500步了,当然这种劝导是循循善诱,而不是命令,要让用户感觉他们是有自主选择权的,Jawbone产品经理Kelvin Kwong表示:“我们不能让用户感觉自主权受到威胁。”
2014年年底,Jawbone完成了一轮2.5亿美元的融资,公司估值达到33亿美元,比起上一轮融资的时的估值翻了一番还有得多,那个时候Jawbone还没有走上大数据发展道路。很多投资者都在Jawbone身上押了注,相信Jawbone将不仅仅是一家健康手环制造商,还会成为成熟的物联网中间人。Jawbone已经和三星旗下智能家居平台Smart Things达成合作,探索健康领域之外的应用。Rahman表示:“通过对你的了解,我们甚至可以告诉你,你在锻炼的时候听什么音乐最合适。”
当然这一领域也不是Jawbone一家独大,竞争者们也是来势汹汹。Fitbit开始进军健康领域。并且似乎每一个传奇行为心理学家都开起了自己的创业公司,力图将A/B测试带入到实体领域,在过去的几年里,他们都在使用亚马逊土耳其机器人(Amazon Mechanical Turk)开展研究,在全球范围内进行劳动力交换,把每个测试对象的测试成本从过去的5、6美元降低到了20或30美分。
从典型到普及 试验公司遍地开花
罗伯特·西奥迪尼(Robert Cialdini)现在在为软件公司Opower自称的全球最大规模的行为研究提供咨询,这家公司建立在他早期关于人类竞争本能的研究成果基础之上。
罗伯特·西奥迪尼是“承诺原则”理论之父,目前在Opower担任首席科学家,用他的心理学技巧帮助节约能源。他做过一个著名的“门上小广告”试验,2007年,他和伙伴们在圣地亚哥走街串巷,挨家挨户往门上张贴小广告,鼓励居民减少能源使用。其中有的小广告主要是劝导人们减少能源消耗,以节省家庭支出或者成为一个合格的公民。有一些只是简简单单地写着:“你的邻居们都在节约能源哦!”后者效果完爆前者。
虽然很难解释,但是人们确实有这种倾向,就是总想邻居攀比,暗中较劲。西奥迪尼的这个发现让哈佛毕业生Alex Laskey和Dan Yates深受启发,他们创立了Opower,并最终请来西奥迪尼本人主导了这场被称为有史以来最大规模的行为研究。
Opower现在已经拥有95家水电费使用客户,数据库里纳税人数量达到4000万,一次能对多达100万客户进行试验。经过试验他们发现,对于那些最有效利用能源的客户,如果在报告上加上笑脸,会帮助他们继续保持下去。但是如果夸奖这些表现良好的客户说,他们比邻居省的多哦,却会适得其反,许多人会将其视为浪费能源的借口,觉得反正我比邻居省嘛。Opower首席行为官John Balz表示: “我们一直都有一个治疗组和一个对照组。”其实组别什么的只是专业术语,实际上就是A/B测试。该公司4月份上市,市值为6.7亿美元。
行为学界还有一位泰斗人物——杜克大学的丹·艾瑞里(Dan Ariely)。最近他与人合作创立了Timeful。这款免费的智能时间管理应用不断地在用户身上做试验,以了解如何通过智能提醒让人们的一天过得更有效率。47岁的艾瑞里表示,他的试验,是对老式试验的一种改良,过去是在试验室里面对面进行试验,而现在的试验能够“更加具体地测试到人们每分每秒的行动”,由此这款应用可以给用户发送更加个性化的信息,相应的短信发送数量也会减少。
芝加哥的LearnMetrics则想要成为教育界的Jawbone,并且现在已经和42所学校接上了头。几个月前,LearnMetrics赢得了亚特兰大的一份合约,测试在亚特兰大的基础教育阶段12个年纪学生中,Chromebook笔记本电脑的学生参与度是否优于iPad。基于成绩、出席率以及登录次数这些指标,最终Chromebook胜出。和其他任何测试一样,落后组会付出一些代价,但这总比整个区从一开始就盲目地给每个学生配发一台iPad要好得多,那样就真成了Google工程师口中所谓的“河马”了。LearnMetrics创始人朱利安·米勒(Julian Miller)表示:“这些学生因此而获得了一个更好的受教育机会,根据他们自己的数据来接受更适合自己的教育。”
丹·艾瑞里是创业公司Timeful的行为总监,通过“自适应算法”对每一个用户进行个体试验。
2.8万亿美元产值的医疗保健行业饱受浪费性支出困扰,现在它正在成为行为科学的塑造对象。一家叫做Pact的创业公司将其健身软件销售给了马萨诸塞州的一些雇主,这款健身软件针对下载了该免费软件的几十万人进行了为期三年的试验。Pact要求用户支付10美元左右的押金,以激励自己进行锻炼。而Pact将用户分为两组,劝导其中一组用户以努力赢钱,同时恐吓另一组用户不成功就罚款。Pact创始人张一凡(Yifan Zhang)就结果发表看法说:“负面(激励)才能让你离开沙发到健身房锻炼。”现在,使用该应用的Pact Health公司员工可以拿到5美元的奖金或者获得同等金额的罚款,这取决于他们能否坚持锻炼,而一切都由他们的智能手机或健身追踪器进行监控。
另一家叫做StickK的创业公司同样把重点放在惩罚上面。在原始网站上,StickK将受测对象分成两组,对其中一组采取鼓励手段,如果完成健身目标,就向他们喜欢的慈善组织捐款;另一组则采取惩罚手段,如果没能达成目标,就要把钱捐给一家他们讨厌的慈善机构(也许是绿色和平组织,又或者是全国步枪协会,就看你最讨厌哪个了)。结果显示后一种方式在敦促减肥方面最为成功。现在,StickK联合创始人兼耶鲁大学经济学家Jordan Goldberg正鼓励新近注册的6家企业客户(其中包括拥有10万员工的公司)使用相同的惩罚手段来激励员工。Goldberg 说:“我们已经在消费者身上进行了A/B测试,因此当我们前往企业洽谈合作时,他们就不会觉得自己的员工是小白鼠了。”
为一睹未来,让我们到创业公司招聘网站Hired上面看看,我们可以看到数据科学家的职位数量正以两位数的速度狂飙,更引人注目的是,“首席行为官”已经成为炙手可热的头衔。“几年前,这样的职位只有20个左右。”非营利性的行为经济学咨询公司ideas42的Jamie Kimmel说道:“现在,在职的行为学家可能已经有数百人之多。”斯坦福大学甚至已经设立了一个劝导技术试验室(Persuasive Tech Lab),对这种职业进行制度化培养。
科技是把双刃剑 磨合期尚未过去
道德合规官难道会坐视不管吗?人们天生不喜欢被当做不知情的豚鼠,Facebook就为此倒霉了一回。2012年Facebook对其动态消息进行过一系列试验,这项所谓的情绪感染试验对70万左右用户状态更新的措辞进行了操纵,使其看起来比实际更加悲伤或快乐一些。这个试验在去年一经曝出,把人们吓坏了,由此引发了全美范围内的舆论抨击和全球范围内的政府调查。人们真正担心的并不是Facebook让很多人看起来更加悲伤,而是Facebook一开始就对这种试验持冷漠态度,还有就是这次曝光的事件很可能只是冰山一角,而我们对此一无所知。据当时的一篇报道披露,Facebook的数据科学团队在进行这项试验时压根没有受到什么监督。
Facebook事件曝光后没多久,交友网站OKCupid的联合创始人Christian Rudder就不甘示弱地站出来说,他的网站也对用户进行了操纵。OKCupid在2014年7月份表示,网站进行了一项测试,在配对方面给予错误的反馈,比如说算法明明说你们不对头,网站却偏偏说你们相性好(反之亦然),以观察配对算法是否有效。Rudder说,结果嘛,他也没听到太多抱怨。他在一篇博客文章中写道:“小伙伴你们造么?只要你使用了互联网,那你在任何一刻都会成为数百项试验的测试对象。”
当然A/B测试也不能是一匹脱缰的野马。作者Nir Eyal表示,网络公司总是会事先进行“后悔测试”。“当我决定在不同的项目上做或不做什么时,我总会先问问自己,如果用户完成了这个特定行为,知道自己刚刚做了什么,他们会后悔吗? ”
Jawbone已经开始着手研究,试图对UP佩戴者的GPS信号进行追踪,这样他们就能在你回家时劝导你“顺便去一趟图书馆”,而不是仅仅要你完成特定的步数。该公司还没有做好把那些测试公之于众的准备。“更大的能力意味着更大的责任。”A/B测试的传道者Siroker说:“工具的使用者需要对其利弊都有所把握。”
目前,这些现代的“广告狂人”们对这个新世界的观察都并不全面。“在过去20年的科技世界,是人类在照顾和维护着计算机。”应用分析平台Appcelerator首席执行官Jeff Haynie说:“而未来20年,将会是计算机来照顾我们。”
还记得上文说的,Jawbone第一个数据科学家Abe Gong么?他认为,豚鼠们最终将找到对抗不速之客的方法,他表示将会“有更多的工具(比如广告拦截工具)来帮助人们控制自己看到的东西。”,并且未来人们将能够选择更多的服务,在健康和时间管理等领域改变自己的行为,他还提出了一个假设:“我想,我们目前正处于被操纵的高峰期。”当然,这个假设之后也会接受试验。
Souce:Forbes
想要了解更多创业创新知识,快速添加猎云网微信号:ilieyun