• 27
吴明辉:数据源、人、场景变化的时候将产生数据生意的重大机遇
统计 阅读时间大约10分钟以上(13484字)

2018-03-29 吴明辉:数据源、人、场景变化的时候将产生数据生意的重大机遇

所以加速了解数据变化是有价值的。

猎云注:本文中,吴明辉认为商业本质是,“一切业务数据化,一切数据业务化。数据产品其实是加速实现和放大决策者在信息不对称中的收益”。文章转自:明略数据(ID:Mininglamp_BigData)。

吴明辉,连续创业者,2006年创办秒针系统,奠定中国营销监测商业模式;2014年创办明略数据,带队研发行业AI大脑SCOPA系统,帮助公安破获多起犯罪案件。

近日,明略数据、秒针系统创始人兼董事长吴明辉,受邀在水滴产品进化营以《数据中的商机》为主题,为学员们系统分享数据产品化商业化的实践和心得。

以下为演讲实录。

大家好!我是吴明辉,我创办了两家数据公司,明略数据和秒针系统,都发展不错。

明略是通过数据提供支持分析决策的行业人工智能解决方案提供商。秒针是用数学的方法将广告投放效果抽象出来的营销洞察提供商。

这十几年的经历,有很多值得讨论的话题,今天我和大家聊一下数据商业化的实践和心得,我会分享四部分:

对数据生意本质的认知

数据行业产品化商业化的核心思考

明略和秒针的价值增长案例

我给大家的一些建议

这些观点都是我自己的归纳总结,也欢迎大家待会儿拍砖。

对数据生意的认知

数据的本质是什么?

数据生意的本质是什么?

数据产品的价值是什么?

刚刚主持人介绍了,我是学数学的,很骄傲是中国最好的数学系,北京大学数学系毕业的。我今天的分享,就从数学、数学家讲起吧。

1

《高等代数》、《解析几何》、和《数学分析》是数学系大一的三门教材课本。其中高等代数对于非数学系的同学,应该叫线性代数。解析几何我估计同学们上大学不一定学了,中学的时候应该都学过平面解析几何,大学数学系学的是三维、四维更高空间的几何,立体解析几何、空间解析几何。数学分析肯定大家都学过,非数学系学的叫高等数学,就是微积分。

数学是特别基础的学科,所有的事情都可以用数学去理解,这三门基础课程有着深刻含义。举个例子,小学学的第一门数学课程叫什么?算术。

算术在数学里面专业词汇叫数论。数论是从哪里出来的?就是数数。为什么人类要数数?数数这个事情研究得越来越复杂是为了干嘛的?其实是为了算时间。看太阳什么时候升起落下,看月相阴晴圆缺都是为了算时间用的。

几何是为了算空间、算位置用的。就像刚刚杨晓老师讲的时空大数据,其实数学的本质就是研究时间和空间,是用XYZ、用12345研究时间和空间。时间和空间是我们研究每一个学科最核心的两个维度,宇宙,宇和宙就是时间和空间。

数学分析研究的是函数和函数的变化,核心是研究变化。

这是数学最基础的三门课。你要知道,时间是怎么回事,空间是怎么回事,变化是怎么回事,这就是数学最基础的东西。

2

对变化的研究,微积分分为微分和积分,这个和我们日常生活有很大关系。微分是不断去研究一个个体变化,研究一个局部、微观的变化,就是个体研究。积分可以求面积、求体积,是求和用的,它其实是统计看宏观的。数学的思想就是数据分析的思想,研究变化,研究微观变化,研究宏观变化。待会儿分享我们案例的时候,会分享数据生意是如何从这些方面去做研究的。

3

千禧年,我因奥数保送北大,北大2000级数学系已经有四位数学家了。照片中是其中的两位恽之伟和张伟,去年刚在美国拿下科学突破奖-“数学新视野奖”。大家有没有听说过这个奖?很厉害的,有“科学界奥斯卡”之称,2013年由俄罗斯亿万富翁尤里·米尔纳设立,阿里巴巴马云及其夫人,腾讯马化腾、Google塞吉·布林,Facebook马克·扎克伯格夫妇,以及苹果公司董事长亚瑟·莱文森等知名企业家赞助。科学突破奖旨在表彰在生命科学、数学和基础物理学领域做出杰出贡献的科学家。有同学能够拿到这种奖了,我也非常骄傲。数学界没有诺贝尔奖,最高奖项叫菲尔兹奖,第二高的叫拉马努金奖。这两个同学都已经得了SASTRA拉马努金奖,号称中国菲尔兹奖的晨兴奖也都拿了,我认为他们将来应该都能拿菲尔兹奖的。真的,我很荣幸能够跟他们成为同学。

4

能够拿那么高级的奖,他们研究的课题是什么呢?给大家看个公式,这个公式证明了一个很牛的猜想,函数域中的高阶Gan-Gross-Prasad猜想,它连接了数论和几何的两个量,几乎打破了这一领域30年来的毫无进展,为数学界著名的7个千禧年问题中的3个问题推出了诸多的解题可能性。

5

这听起来很牛,那数学怎么赚钱呢?数据怎么赚钱呢?这其实是非常远离的两个方向。

先说数学,照片上左边那位是我们年级数学最厉害的叫恽之玮,大家都叫他恽神。我在读书的时候已经是学霸了,中学时代只要我做不出来的题没有人能做出来,每次考试数理化,尤其是数学,老师不是看我考不考第一名,只要不是满分就让我把卷子抄50遍,这是我的老师对我的要求,因为他觉得我不可能有不会做的题。

但是,我去了北大以后,遇到恽神,就是这样一个对比的感觉,就知道差距了。为什么叫神呢?我给大家举个例子,在本科期间,恽神数学专业课19门100分,7门99分,其中不乏大一时便已修过的高级课程。不免要感慨一句,这样的成绩,我们可能只在小学一年级的时候考过。他在本科毕业申请到美国读研究生的时候,只给美国前十名的大学写了申请,后来只有前四名给他发了offer,第五名开始给他的回信都是:亲爱的恽之伟同学,You are over qualified,反正你也不会来的,给你发Offer也浪费我们的资源。真是神一样的人物,这是真正的学神,我只能叫学霸。

我在读大学的时候,一直是蛮跨界的人,初中二年级开始编程,当年是数学、物理、化学、计算机,每一科都参加竞赛,每一科都在前几名,数学最好而保送北大。大一的时候,学校举办数学建模竞赛,建模竞赛和刚刚杨老师讲的问题类似,也是需要设计一个模型再进行解释。我当时就去找恽神,我知道这个人太牛了,国际奥赛金牌,我说:“恽之伟,你数学最好,我编程最好,咱俩组个队吧,就天下无敌了。”我那个时候就表现出来知道怎么去找正确的合作,因为我当时是数学系里面编程最厉害的,我是我们系里面唯一一个初中就开始编程的人,连续参加五届计算机竞赛取得大奖,其他同学连编程是怎么回事都还不知道。恽神是我们年级数学最厉害的,我们俩组个队那不是天下无敌吗。然后他语重心长的跟我说:“明辉同学,我们学数学不是用来做应用的。”这充分的打击了我,我也知道了跟神的区别是什么,在他的脑子里面数学就是理论不考虑应用。我告诉大家他到现在没有微信,不用智能手机,大家能想象吗,如果我们联系他的话只能发邮件。我有好几个在美国的同学都是这样,只能发邮件联系,顶多发短信,这是真正的数学家。他们的物质生活是很辛苦的,大家看拿了世界级这么厉害的奖,奖金十万美金,数学家国家科研资助的钱也不多。数学离商业是非常非常远的,真的是没有什么关系。

那数据如何赚钱呢?数据的价值是什么?

6

今年春节我去了新西兰,中间有一站到了美丽的特卡波湖,去过新西兰的同学大都会去这一站,这是全世界最有名的观星地点。这里几乎没有什么光污染,晚上没有云彩的话就是这样的景色,随便一个单反相机,只要曝光时间长一点就能拍出清晰的银河系。

看到一闪一闪的星空,我就想古人花很多时间和精力去研究星星,价值是什么?

天文学家开普勒,提出了行星运动的三大定律,是现代宇宙理论的基础。开普勒能做到是他很幸运地能够得到著名丹麦天文学家第谷·布拉赫20多年所观察与收集的非常精确的天文资料。

7

所以数据是什么?数据其实是对世界观察的一个数学记录。

数据它的价值是什么?是帮助那些没有观察的人解决信息不对称的问题。

因为每个人的时间都是有限的,你没有时间去观察星星,我看完记录下来,等到开普勒需要计算的时候,把数据拿出来给他。再举个例子,大家做金融风控,看一个家庭有没有还钱的能力,以前你没有时间和精力去看每一个家庭,今天有了大数据分析,基于这个数据表现出来他有能力还款,所以我可以贷款给他。每个人都需要信息、数据解决类似问题,数据可以做很多事情,可以帮助科学家归纳总结、可以提出猜想假说,这是数据的价值。

数据跟数学还是有一点区别的,数据是客观世界的记录。

8

我的观点是用数据做生意是一个悖论,我们上午讨论提到各种案例数据不靠谱,我的观点是一样的,数据确实是不靠谱的。我为什么认为数据不靠谱,数据做生意是一个悖论?我觉得数据和生意这两个事从概念上就是矛盾的,数据是解决信息不对称的,生意本质是什么?是利用信息不对称的。马云说一切信息不对称都会被互联网颠覆,但事实上,他们自己成了数据垄断巨头。数据和生意怎么放到一块去,这看起来就是很矛盾的一件事,怎么用数据去做生意它确实是一个问题。

商业的本质是信息不对称,怎么解决信息不对称的过程中还去赚钱呢?举个例子,解决广告行业的信息不对称问题,以前有一些广告公司通过低价买一些很烂的流量,高价卖出去赚中间差价,利用信息不对称赚很多钱,买方和卖方,卖方不知道谁想买我的流量,买方不知道哪个流量是好的。

秒针的出现颠覆了这个模式,因为我们非常清晰透明的告诉大家哪个流量好,哪个流量不好。我们做收视率分析、做广告监测,这个市场被我们彻底颠覆了,本来大家都能赚钱的现在都不赚钱了,我们虽然赚了一点点钱,但比它们少太多了。收视率市场,最近电视广告一直在缩水,中国市场以前最高峰的时候大概有三千亿,现在降到不到一千亿了。

我们以前做互联网收视率,不做电视收视率。电视收视率中国最大的公司叫央视索福瑞,在海外最大的是尼尔森,央视索福瑞一年的收入在中国估计是10个亿,大家觉得也不少钱了。但是你知道黑产,做收视率刷榜那些公司一年能赚多少吗?40个亿。这个收视率刷榜怎么做呢?污染样本户。央视索福瑞是通过抽样调查的方法来统计收视率的,一个城市比如说北京两千多万人口,抽样1000个家庭,平时看什么台统计一下,最后预测,整个北京市大家都在看什么台。造假怎么造呢?只要搞清楚这1000家在哪里就行了。然后到他家里说,我是某某卫视,如果你每天看我们台,我一年送你50斤花生油。很多样本户就这样被污染了,1000户里面影响50户就能让收视率上来5个点,他一年收入可能就能多10个亿。所以黑产其实是比做数据生意的公司本身赚得还多,用数据来去赚钱其实不是赚钱,是在破坏别人赚钱的机会,所以说这是一个悖论。

9

解决方法呢?确实也有很多人用数据赚了大钱。

举个例子,如果你把数据真的理解成为一个底层东西的话,实际上可以认为绝大多数商业都是在利用数据赚钱的,只是大家赚钱手段不一样。商业是利用信息不对称的,信息不对称在我的观念里面分为两种,一种是一次性的信息不对称,一种是持续且流变的信息不对称。

什么叫一次性信息不对称?有人说某个股票要涨,这是一次性的信息不对称。你能拿这个信息来做生意吗?你告诉一个人,那个人马上告诉一百个人,一百个人告诉一千人,这个信息只能告诉别人一次,把这个作为一个信息数据来卖是不靠谱的,因为他卖给一个人,其他所有人也都知道了。所以利用这种信息来去赚钱唯一办法就是你自己把这个股票买了。一次性的信息不对称这个事只要做完了就没有了。

流动的信息不对称是有机会做生意的,每天这个事都在发生变化。比如说广告投放每天都在发生变化,一个电视节目今天好看不一定明天好看,一个网页今天流量大,不一定明天流量大,这些是每天都在持续发生变化的,是你可以去利用它做生意的。只有持续流动的这种情况,你才有可能利用数据做生意。一次性的信息不对称,把这个信息用到最好就行了,就是自己闷声发大财。

举个例子,零售选址是一次性的问题还是一个流动的问题?我以前觉得这个没有什么商业价值。如果你开快餐店就看麦当劳,某个地方很好麦当劳已经在了,直接去旁边开店就完了。如果做零售的话就看优衣库和无印良品。我和他们的总裁交流过,他们选址方案非常牛,牛到什么程度?在全世界每一个国家、每一个区域都是做的不同模型。这个模型是跟当地最牛的研究学者一起去做的,比如说在中国肯定会找北大去研究,在日本是东京大学做的。我看那个表参数都不一样,精细化的程度研究到这个店在几层,底下有几层,地上有几层,研究参数全部都放进去了,非常复杂。绝大多数人他自己没有去研究,直接参考麦当劳、优衣库的选址,所以,感觉选址没什么生意的机会。

但是我后来发现确实有公司持续通过选址服务赚到了钱。这段时间,我正好也研究了一下新零售,招了一位以前做新零售的高管。他给我讲说,选址也是一个流动性问题,是天天发生变化的。我们有一个客户是中国最大的便利店集团,有一万家店,今年还要开几千家,每年都要开几千家店,但同时每年又都要关几千家。他要不停的选,因为今天选择了一个好地方,明天不一定好。比如今天在这里开一个店7-11,明天突然旁边有人又来开了一个物美,你的客流就被抢走一半。因为你周围的环境在不停变化的,这件事情就变成一个流动的信息不对称问题了,它是有商机的。有些行业变化慢就没有机会,有些行业变化快,你就有机会在这里面去做生意。它不停的变,才有机会利用数据赚钱,它是有商业价值的,这是一个非常典型的例子。

10

所以我们要研究一下,把数据变成一个产品它的价值到底怎么去表达出来呢?

我刚才讲了时间很重要,空间很重要,数据我认为它是一个时间的朋友,因为时间是最值钱的。我们每个人的生命都是有限的,最宝贵的财富就是时间,如果你能帮助一个人减少时间浪费提高效率,就有机会来用它去创造价值,就有机会把这个数据变成一个产品去卖,所以数据产品价值其实就是帮助人来节省时间提高效率。

111

我把它分成两个方向,第一个是数据创造信任,这也是秒针系统的slogan。信任的价值是什么呢?降低决策成本。这是数据非常重要的一个价值,比如说广告主打广告,他一直犹豫这个广告到底投不投,无法决策,有一天知道了秒针,他拿秒针数据一分析,或许这个数据的归因分析还需要进一步完善,但是他已经对广告效果的信息有了更多的了解,就能做决策投吧。

秒针通过数据说这次广告投得不够、在哪里投广告效果特好,这就是秒针的可信的价值。其实这个数据是否全面是第二位的,第一位是它促使决策者快速做决策。没有人是在了解百分百信息下做决策的,他了解部分信息他就去做了,这就是数据创造信任很重要的一个价值。因为很多事情你做了才知道对不对,一直犹豫不决,机会就丧失了。即使最后你失败了,也是一个成功,不做是完全没有价值的。所以数据创造信任,那个数据本身已经不是最关键的了,信任是最关键的。信任降低整个社会最核心成本,大量成本都是因为不信任产生的,有了信任我们整个社会效率就提升了,我们就有价值了。秒针这样的公司是通过数据创造了信任,从而创造了很大很大的价值。

12

同学们上午都分享了很多例子,我从理论上帮大家证明一下,为什么数据其实不一定是真的,甚至一点用都没有。我前面写了一句话,数据不能证实只能证伪,这是科学家首先要知道的第一件事情。如果你想读博士,想当科学家,必须学一门课《科学导论》,这门课最核心思想就是说其实这个世界上没有真理。有关这个观点,还有一本书我推荐大家去看,通俗易懂的版本叫《世界观》。

这个世界上没有真理,任何大家觉得肯定是对的东西,都是通过严密逻辑推理的东西。逻辑推理里面有三段论,第一段是前提假设条件,条件为什么是对的呢?如果你要证明那个条件是对的,它又有前提假设,一层一层往下推,推到最底下那层推不下去叫什么?叫公理。公理就一定对吗?在平面几何中“两条平行线永不相交”。但在黎曼几何中有一条基本规定是“在同一平面内任何两条直线都有公共点(交点)”。在黎曼几何学中不承认平行线的存在,它的另一条公设讲“直线可以无限延长,但总的长度是有限的”。所以这个世界上没有真理,所有的问题归根结底推到最底下的地基都没有人能证明,所以数据是证明不了任何事情的。但数据有一个重要的作用,可以用来证伪。比如爱因斯坦的相对论,让天文学家发现水星在近日点进动的观测值与根据牛顿定律计算的理论值存在一个每世纪43角秒的偏差得到合理解释,同时证明了牛顿经典力学出问题了。它通过一个观察记录的数据证明这个事情是错的。为什么?因为这个世界每天都在产生新的维度,每天都在产生新的变量。

我家老大现在上小学二年级,经常会遇到这种题目,给以下数列找规律,写下一个数是几,比如说1357下面的括号肯定是填9,我相信大家都会填9。但是,学数学的就知道,其实那个括号填什么数字都行,只不过拟合出来的那个方程式是一元一次方程、还是二元一次方程、还是三角函数,什么都能拟合出来的。你根本就不知道那个序列最一开始是什么方程,是线性的还是非线性的,什么都能拟合出来。所以过去证明不了未来。

我前两天给我儿子讲时间是怎么回事。我给他讲7天是一个礼拜,每年有12个月, 1月大,2月平,3月大,4月小,我说2月很特殊,为什么叫2月平,因为2月有28天,我就给他出题了,哪一年的几月几号是星期几,按道理应该能算出来,但是中间出现了一个干扰叫闰年,不是每一年2月都是28天。你观察一百年的时候,突然会多总结出来一个规律就是多久会出现一个闰年,再隔一千年的时候你会发现那个理论又需要调整了。前面讲的小周期还是大周期,越大的周期会发现新的维度,新的变量,会不断的发生。你会发现这个世界上没有真理,数据不能证明任何一件事情,只能证伪,这是整个科学发展告诉我们的一个非常基本的道理。

数学推理和公理加在一起,有公理再加上严密的逻辑推理才能证明一些东西,但是你证明的只不过是一个命题或猜想而已。为什么?因为一切都建设在那个公理上,逻辑推理那个过程是没有问题的,但是你的公理错了就全错了,这是数学最基本道理。数学里面专门有一个学科就叫《数学基础》,不是叫基础数学,数学基础研究的就是这些东西。很多数学家都在研究这些底层的东西,有很多东西也是哲学问题。

既然数据是没办法证实的,但我刚才讲了数据有一个很重要的价值是可以产生信任,为什么可以产生信任呢?

13

我从控制论角度再给大家讲一下为什么,控制论也是现代科学里面非常重要的理论,任何一个人做决策或者是一个系统向前推进过程中,有这几个环节:感知、理解、决策,最后行动。

给大家举个例子,飞机在机身上有很多传感器,平着飞,突然来了一阵风倾斜了一点,传感器就会告诉大家已经左倾了,这个时候它会自己调整,调整一下机翼的角度往右倾一点点了。这是不断适应,不断调整的过程,这是控制论的逻辑。

其实我们人做决策也是这样的,大家每天都是去观察,眼睛、耳朵、鼻子、身体的触觉都是传感器,你感知到外界的变化,然后理解、思考最后产生行动。你的传感器它最后给你大脑拿回来的是什么?就是数据。所以数据为什么能够增进信任呢?是因为人的大脑有一个重大Bug叫能不动脑就不动脑,这是心理学里面很重要的一个结论。我以前是学人工智能的,花很多时间研究脑科学和心理学,脑科学相当于大脑的硬件,心理学相当于大脑的软件,所以这两个东西都要学才能搞清楚人工智能是怎么回事。

人大脑最基本原理就是能不动脑就不动脑,感知系统要耗费你的能量,认知系统,比如眼睛把外部信号翻译成符号传到你的大脑的时候,大脑再通过逻辑推理做决策也要消耗能量,这两个都消耗能量。

14

有一本书推荐大家看一下《思考的快与慢》,这是一位心理学家、经济学家、教授,丹尼尔·卡内曼写的。他讲人的大脑分为系统一和系统二,系统一是直觉系统叫快系统,系统二是逻辑推理的慢系统。

系统一是非常快的,耗能相对比较低,一个人每天日常的新陈代谢都是系统一消耗的。每天的运动根本不经大脑逻辑,你往前走可以自己调整得非常好,完全直觉就控制了。很多同学我估计大家经常开车回家怎么开回去的都忘了,就是系统一在驾驶,实际上今天无人驾驶系统是一个系统一,它是一个直觉系统。

系统二是逻辑思考,逻辑思考这个系统很复杂。这个系统其实是人脑设计得不太好的,它消耗的能量很大,特别消耗体力,所以多思考是有助于减肥的。系统二思考的过程中是没办法并行的,系统一是可以并行的。你的左手和右手是可以并行的,比如说弹钢琴左右手并行已经变成直觉了,你走路手脚都可以并用。系统二你会发现你不可能同时算两道数学题,想要同时算两道题那就是用计算机的方法叫中断,第一题算一下然后中断,算第二题,再中断算第一题,没有并行的情况,只能跳来跳去,所以多任务处理是挺讨厌的。大家都发现多任务处理是人类重要的技能,但是很麻烦,很消耗体力、很消耗能量。

系统一是通过人的直觉系统,通过人的感知系统,把外界信号翻译成数据或者叫符号。什么叫符号?人类的文字就是符号,数字也是符号,这些都是符号。我相信大家现在绝大多数的公司肯定都在做人工智能相关产品。人工智能在发展历史上其实有两个重要学派一个叫符号主义,一个叫连接主义。现在的深度学习就是连接主义。大量的工作其实是符号主义相关的工作,像知识图谱,逻辑推理,机器推理这些东西。

什么是符号主义,什么是连接主义?连接主义其实就是人类的直觉系统,你看今天讲的机器视觉CV算法,人脸识别相当于在模拟的眼睛。现在大家眼睛望着我,相当于你身体上的两个摄像头,摄像头拍了一段视频,但是你脑子里面绝对记不下这个视频,这个视频内容太长了,信息量太大了,最后你脑子里面只记下了“吴明辉”,这三个字就是一个符号。今天你的眼睛把这段视频翻译成了吴明辉这三个字,你的耳朵是把我刚才说的这些话翻译成了文本,后面听到音乐的话变成了旋律。其实你是在把信息量很大的信号最后转变成了信息量很小的浓缩的符号,这是连接系统、人类的直觉系统最核心做的工作。这些符号最后在大脑系统二里面再连接一下,在上面进行逻辑推理,有了底层符号有了语言这些东西才能在上面做逻辑推理。还有一本书也推荐大家《人类简史》,现代智人为什么这么牛,就是因为现代智人有了语言系统,有了想象力,有了逻辑思考能力,这些系统底层架构是什么?就是符号。没有符号逻辑没法推理,逻辑本身就是符号,所以这就是连接主义、符号主义。

我想给大家阐述一个道理,从心理学上,为什么数据可以产生信任?人决策的整个过程是,先感官系统翻译外部信号变成符号,第二步再把符号进行逻辑推理加工有个决策过程,产生最后的决定,最后行动。第一步第二步都消耗能量,可信任的数据可以直接让决策系统绕过第一步,直接进入第二步,直接给第二步提供了符号,加速了人类的决策。比如秒针说这三个媒体,第一个媒体CPM更便宜,第二个媒体CPM特别高,第三个媒体全是作弊的,这是秒针的报告...你觉得秒针挺靠谱的话,你就不会再动脑思考一遍这个数是怎么算的,逻辑是怎么回事,你就直接做决定了。因为你自己已经有了这样一个决策系统,秒针说CPM低的而且不作弊的我就去买,这是你的决策系统你的系统二,系统一是秒针帮你完成的。人脑重大的Bug就是你不去判断这个数据产生的过程是不是对的,你就会相信这个数据,因为大脑就是能不动脑就不动脑,这是一个最基本的原理。所以从心理学角度来讲,有数字给老板汇报,就比没有数字更容易获得老板认同,这个大家应该都可以理解。但前提是什么?你要搞清楚他的决策流程是什么,他的决策逻辑是什么,他的方法论是什么,基于它的方法论给他这些Input。数据本身可能没有用,但就因为这些数据是可以让领导者快速做决策,它的价值是非常大的。

我给大家讲一个故事,也可以认为是一个笑话。在东北有很多土匪,有个电视剧《乌龙山剿匪记》,后来有很多研究表明,那些土匪都是特别信算命的。有一些学者就去研究,发现有一个特别神奇的事情,就是不算命的那些土匪最后都没了,都被剿灭了,或者说都散伙了。最后再去逻辑推理一下为什么,发现一个有意思的现象,凡是算命的哪些人每天都会算一下,今天应不应该下山去抢劫,Yes就下去抢了,No就不抢了,这是一种情况。另外一种情况土匪是不算命的,每天都下去抢,抢到最后的情况是什么呢?彼此质疑,谁也不信谁的,所以他们就只能散伙了。所以我想说的事情是什么呢?算命这个事情和大数据道理是一样的,只是让决策者更快的做决策,让你觉得有用,实际上不一定是真实的依据。

中国历朝历代的那些军事将领,开战之前也都算命的,它其实是鼓舞士气增强信心。一点科学道理都没有,但是你算一卦,你号召战士们我们要往前冲,我们一定会赢的,这是非常有用的。首先人要相信自己,相信你的团队,然后你才能做到这些事情,数据很多情况下就起到这样的作用。我这是从纯逻辑角度告诉大家,数据就起到了这种作用。不要听各种各样的人忽悠你。

15

还有一个例子,前两天我去新西兰,麦卢卡蜂蜜是新西兰著名特产。我从网上找了几张照片,瓶子上面有些数字是10+, 16+,20+,每一瓶蜂蜜上都有这个数。这个蜂蜜号称有一个卖点,就是治胃病。在新西兰超市我看到上面写的26+,一小罐蜂蜜标价2600纽币,相当于一万多块钱。这时候销售就过来介绍,先生你看这个蜂蜜特别好,为什么?可以治胃病,因为这个蜂蜜有一种非常重要的麦卢卡植物提取出来的成分,成分含量不一样而有不同的数值,成分越高治疗胃病效果更好。如果你现在刚做完胃部手术,要买20+的,如果你曾经犯过胃病现在没什么大事了买15+就行了,如果一直都很好你买5+、10+就行了,它们之间的价格差别是什么呢?基本上每加一个5价格就加倍。

那天我为我的岳父买了很多。在这个过程中,我想告诉大家这个数字对我来讲特别重要,包括对我岳父也很重要,因为他觉得吃了这个蜂蜜胃就会好。但是你说这个测量,测得一定准吗?我想未必。但是它确实能起到这样一个非常有意思的效果,让你快速做决定,短短几分钟你就花了几千纽币买了很多蜂蜜回去,这就是数据产生的价值。如果能学会使用这样的数据产生这样的价值,你一定会赚钱的。

16

好了,我再说数据第二个价值。毕竟我也是搞科学出身的,所以我给大家从科学的角度解析一下,数据实实在在一个很重要的价值,它确实可以减少人类的试错成本。

人类所处周围环境是不断在发生变化的,这个变化对于每个人都是商机,如果你把握住了变化规律你就可以去赚钱。咱们产品营上一期的刘煜同学,他做了一个可以查房价的APP兔博士。他说之前他尝试做过一个事情,每一个小区房子都有两个价格,一个是报价,一个是成交价。这个报价可以从哪里看?去58同城,安居客,卖二手房挂出来的价格就是报价。但是通常成交价都不那个价格,这个房子说一千万最后卖可能是一千三百万卖的,也有可能是八百万卖的,成交价如果高于报价的话就说明这个小区要涨赶快去买,成交价如果低于那个报价就说明这个房子要跌。成交价从哪里弄,房产局那里能查到,但也未必能找到一定准确的,最后你要去看成交价和报价之间的差是怎么变化的。所以这其实就是一个国内选房子看小区比较简单的办法。如果你一旦能够预测变化的话,确实这里面赚钱的机会就有很多。

前面说了预测是不准的,历史不一定能够证明未来,数据只能证伪不能证实。为什么只能证伪不能证实?是数据太复杂了,经济环境太复杂了,有大量因素就是如果我们把这个房价最后变成一个f(x)的话,有多少维度呢?可能是一万个维度,可能是一千万个维度。大家都听说过蝴蝶效应吧,可能一个莫名其妙的小事情,一只南美洲亚马孙河边热带雨林中的蝴蝶,偶尔扇几下翅膀,你家小区房价涨了一倍,有这个可能的。有一本书叫《复杂》我强烈推荐大家去看一下,里面讲的就是这个话题。

《复杂》那本书最后一段讲了最重要的一个课题,世界是复杂的,但有一个现象是什么呢?这个世界绝大多数情况是连续的。虽然复杂,人类对长期的未来很难预测,但是短期未来是可以预测的,也就是说昨天、前天、大前天、前面一年的情况,预测明天、后天是有可能准的,但是预测一年以后可能是全错,所以这是一个重要技巧。大家炒股的话,程序化交易高频交易其实在用这个道理,就是短期可预测,长期不可预测,这是复杂性系统讲的一个现象。而且复杂性系统背后的数学原理到今天都是这个世界上没有解决的数学难题,真的是解决不了,到现在为止我的那几个同学也解决不了。但它背后所揭示的这样一个现象很有意思,很多事情变化是连续的,你非常快速去做交易是可以赚到钱的。

17

分析变化里面你既要分析宏观变化,也要分析微观变化,宏观变化就是我刚才讲的通过观察宏观趋势是可以预测未来的,但是你也别指望它能够预测很久的未来,只能预测短期未来,因为未来是不确定的,随时都有可能会出来一个新的参数。举个例子比如说国家政策调整对于地产行业。

前面做得再好都没有用,随时都可能产生一个新的参数你怎么可能预测呢?但是特别短的时间可以做这件事情。微观价值是什么呢?这里面特别重要,我给大家好好讲一下,微观的价值是用于比较的,我们需要按照各个不同维度去细分,细分到最下面然后去看个体和个体比较,这些比较一旦比出来就会发现这里面有最佳实践,大家应该都听说过一个故事:

这个事情从逻辑推理是推不出来的,你也不知道这个道理,但是你通过比较个体是可以寻找出这里面的最佳实践的,这就是微分的价值,这就是数学分析的价值。

就像刚刚讲的选址问题,动态定价的问题,你确实掌握不了动态定价,但是你有很多方法或者周围其他人曾经定过价去参考他,看谁定得好,谁赚得钱多,谁定得最好,你通过不停的比,最后就能够掌握最佳实践,这件事情是非常非常有价值的。

1990年,杰里.斯特宁被国际慈善组织派到越南去解决越南儿童的营养不良问题。但发现没钱、没人、没资源。并被要求半年之内做出成绩。很多人建议他写份报告就回美国。告诉组织,越南需要先发展经济,然后发展教育,母亲们的素质提高了,孩子的营养问题才能解决(这就是正确的废话,生活中到处都是)。斯特宁没有这么做,他拿着尺子下了乡。经过测量,选出了家里又穷身体又健康的孩子们。然后去调研,发现这些孩子家里都吃四顿饭,妈妈会去稻田抓小鱼小虾给孩子吃,还把番薯叶的汁淋在饭上一起蒸。于是斯特宁在村里带着母亲们一起做饭,就用这几招。6个月后,当地65%的儿童营养问题得到改善,并持续下去。

这种解决问题的思路就叫做“寻找亮点”。人经常会喜欢把焦点放在负面的问题上进行分析,得出一大堆不能成功的理由。这就是正确的废话。只有找到亮点,并且认真分析,才能找到改变的正确方向。

为什么说时空分析很重要呢?时空分析也是这个价值,大家都知道孙正义的投资理论,叫时光机理论。因为全世界不同地域上的经济产业发展是不平衡、不均匀的,所以有的地方会领先。美国比我们发展得快,美国是最佳实践,你就可以参考过来。这背后有一个假设是什么?历史总是惊人的相似。如果这个假设前提是对的,你就可以这么干。

不同城市它的发展也是不一样的,比如我开一个餐厅,我是肯德基,我有一万家,哪个餐厅经营得好,哪个餐厅经营得不好,我经过微观比较,可以把经营最好的那个餐厅店长拉出来给大家讲一讲你到底是怎么经营的,这就是数学分析的一个方法。而且这种分析其实是可以创造一些新的方法的,创造力是来自于群众的。其实肯德基CEO也不知道怎么最好的经营餐厅,有一万个店长在实践,经营好的人讲一下为什么经营得好,经营不好的人给大家讲为什么经营得不好,这么一比你就知道怎么做更好了,所以数据分析通过时空比较是可以帮你寻找最佳实践的,这是一个非常重要的价值,节省你做业务决策的试错成本。你本来是要乱试的,但是经过比较你会发现有一些方向不用试了,这就是它的价值,在这里面创造的价值是数据的价值,是信息的价值,你可以把它变现了。

18

宏观,比如说国家每年都要做人口普查。整个IT产业之所以能发展起来,其实就是因为人口普查,当年美国做人口普查的时候花了很多钱,他是请了几百名骑警,拿着打卡器,路上看到一个人按一下,把美国所有的地方都跑一遍。大概花多少时间呢?七年,就统计了一下美国到底有多少人。

中国现在每十年做一轮人口普查,国家统计局每年都在花很多时间忙这个事情,右边这个网站是我们给国家统计局做的叫“国家数据”,涵盖中国几乎所有核心的经济数据。国家需要利用这些数据去做决策,它要去比较不同城市,不同的小区的经济情况,人口的情况,要做各种各样的比较,比较完了以后去做决策,到底这个地方是不是应该再多修一个医院,这个地方是不是应该多修个机场。

人口普查是去算不同单位上各种各样的经济数据,能够带来极大的价值,修错一个机场可能几百亿就没了,所以这个事值得做。你分析出来的变化,它所产生的影响越大你数据分析的价值就越大,它可以耗费的成本就越大。所以古人为什么要夜观天象,它影响很多事情,影响农业生产,要去分析农作物的播种收割,甚至还影响到政治。所以数据记录一定背后要有一个动机才可能产生记录这个数据的成本,因为记录真的要很多精力很多成本。

19

我刚才举了一个统计层面的数据,微观层面的比较就更多了。比如说精准营销,上午大家都讨论了,人群画像靠不靠谱,千人千面投不同的广告靠不靠谱。其实包括我们去抓坏人这件事情,也是一个微观的事情,要微观分析这个人是好人还是坏人,它也有很多价值,这里面也是减少试错成本。为什么?我走在大街上看到每一个人都像好人,警察不是,警察走在大街上看到每一个人都像坏人,我爸爸原来就是警察,他经常一眼能看出一个人是坏人,但是有时候他判断会出错的,数据分析可以帮助他验证一下,数据可以帮他证伪的。中国警力是远远不够的,又有很多案子要处理,只能先处理那些大案要案。所以你能通过数据帮他证明一个人是好人或者是坏人,这个时候就帮他减少出警的成本,对他的价值是很大的,他一个人可能就顶三个人了。这个和我们精准营销的道理是一样的。同样的广告费能不能给更多的目标群体。所以本质上明略和秒针的生意是一回事。

20

我总结一下,数据本身其实是没有价值的,大家不要指望着直接卖数据赚钱。数据价值是来自于什么呢?是你看到这个数据之后所做的后续的决策价值,如果你看到这个数据之后是做国家决策,比如修机场,这个数据就很值钱。如果看到这个数据最后决定明天早上吃肯德基还是麦当劳,这个数据不是特别值钱的。数据的价值,或者一个数据产业的价值,完全是取决于这个数据产业所应用的场景。

我也做天使投资,有一次有个师弟就跑过来说:师兄我现在有一个特别牛的创业项目希望投一点钱给我,免费停车。他想把停车场包下来,把收费系统全部改成NFC扫二维码的电子化停车收费系统。扫二维码可以免费停车或者打五折,我说你这个亏钱,他说我可以利用大数据赚钱,可以采集很多停车大数据,他说你看有车的人都是有钱人。我问这些数据拿回来能干什么?他说还没有想过,好像APP流量也不少吧可以卖广告吧。

我就帮他算账一天会有多少日活,一个CPM多少钱,按照全北京最贵的广告位去卖,一个CPM多少钱,算到最后他就回去了,然后就不干这个事了。

所以我见过无数的公司拿一个商业计划书就说我这个模式很牛,免费模式最后产生大数据很牛,大数据就值钱,大家千万不要信,数据不一定值钱。数据要放在真实的商业环境里面,商业环境要有真实的价值,我刚才讲了很多的环境,哪怕你去帮人卖蜂蜜都是有真实的价值,如果你想当然的认为有数据就一定能赚钱这绝对不是的,绝对是一个假说、是一个猜想。

21

上一次有个老师给我们讲过产品经理的一个重要的公式,大家应该都知道,产品价值 = 新体验 - 旧体验 - 替代成本,这个公式是写得非常深刻。具体聚焦在数据产品上面,它的价值公式应该是什么?这里面总结了一下,决策者在使用你的数据产品之后,应该会提前了解到变化,数据产生的价值就是让你提前了解变化以后,它可能针对自己的业务节省成本或者产生新增的价值,这个其实是数据产品的新体验减去旧体验得出的结论,当然还要减去替代成本。这个替代成本不要小瞧,替代成本可能有时候不是正数可能是负数。数据这个行业有的时候数据成本是在降低的,一个新的方法有可能成本比原来还低,替代成本是一个负数,你一减负数还变正了。我们不断去优化数据产品价值的方法论,要么把前面的数变大,要么把后面的数变小,最好是负数,所以这就是数据产品的产品公式。

22

数据产品的目标就是要加速实现和放大决策者在信息不对称中的收益。加速也很重要,这个信息你了解得越快越好。像秒针所在的行业收视率领域。最早的收视率是用日记卡做的。就是家里面给你一张卡片,每天晚上看完了电视,像写日记一样在卡片上记录都看了哪个台。这个卡一个月来收一次,收回之后再统计十天,最后就知道了上个月收视率是怎么样的。

大家知道98年中国最火的电视剧是什么吗?《还珠格格》。这个电视剧的收视率是什么水平呢?40%,一百个家庭有40个家庭在看。但是那个时代收视率统计是延期一个月,那个电视台卖广告也没赚多少钱,他根本就不知道原来这么受欢迎。买了这个电视节目的广告主就赚到了,没买到的广告主,本来可以提前知道很有价值的,就亏了,也是一个重要的商机就亏了。谁提前感知到这个变化,就是有价值的。后来这个统计方法被收视测量仪替换掉了,就是给你家歌华有线之外再装一个机顶盒,用那个机顶盒看电视,每一次换台都会通过电话线传到它的数据中心,可以实时知道收视率的变化了。同样,这个数据因为样本量太小而太容易被污染了。

23

所以加速了解数据变化是有价值的。秒针在广告领域解决了这个问题。互联网做监测,而且精准广告更是这样,每个个体都是在做调整的,每个人都可以看不同的广告,所以它能产生很大的价值。

1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:lieyunjingxuan
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
4、联系猎云,请加微信号:jinjilei
相关阅读
推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×