大数据江湖的七十二骗

2017-02-17 09:35·  计算广告  某码皇 
摘要大数据领域,你只要强调“大”就可以了,诸如一天处理多少TB的数据,在某细分行业占据多大的比例。具体来说,宣称自己在全国公厕安装了免费WIFI,根据刷WIFI的时间判断是否便秘,从而精准定位到痔疮患者。

  前两年,Peter Thiel(以下简称彼得)来了一趟中国卖书——如你所知,就是那本《从0到1》,和《失控》一样,目前基本上成为了互联网行业骗子人手一册的玩意儿,类似《麻衣神相》《水镜全编》,或者干脆叫《如来神掌》也无不可。BTW,彼得是个有私人飞机的亿万富翁,按说瞧不上那点儿版税,不辞劳苦跑到中国做签售,其实主要是借书来拓展行业影响力——这既是当代媒体社会的本质,也是深谙“话语权”玩法的常见手段。总之,蒙友人赐票,我瞻仰了彼得接见互联网创业青年们的大会,我觉得这人书写得虽然杂乱了一点,上了台说话倒还比较实在。后来,读到他说搞“大数据”的人里骗子居多,也就不太奇怪。

  按说彼得本人就投资过数据领域的公司,而且投的还挺成功,就是那个Palantir,这事儿其实有点微妙(关于Palantir我们将来再聊),和彼得那句话再一联系,基本上也能对国内“大数据”投资这把虚火有一点洞见,大意来说就是:

  1. 不要对“Big Data”这件事抱什么期望,尤其是不要用这种期望去指导你投资的估值;

  2. 数据并非没有价值,但你去投资一家所谓Big Data的企业时,核心问题是企业的商业模式,而并不一定是看它有多少用户和数据。甚至在中国的环境下,即便数据的“成色”非常好的企业,也可能隐含着各种各样的坑;

  3. 千万记住:张嘴说自己是“大数据”行业的人,请先给他个有罪推定——这行儿骗子多,哦对应着最近出的那个2016年度“中国大数据创新百人榜单”,各位可以自己联想。

  一般来说,这一行儿的骗术不外乎如下几种手段:


  最高级的,当然是直接搞政府的钱

  比如说,本人曾参观某企业为某县级政府建立的“大数据中心”——你一进去先请你进会议室座谈,铺绿呢子的台面儿上每人一个印着名字的桌签儿,一个烟缸儿(信息量很大的一点,至于为什么,自己去品。品不出来的打赏10块找我解答),一个白瓷茶缸子(我经常依靠里面沏的什么茶来判断一会儿该往哪种路子扯淡),一个热手巾板儿,一份打印好的项目资料——翻开一看不留神以为是党章。座谈基本上是颂圣,然后众人被鱼贯押入演示大厅,有身披红色礼仪绶带的女讲解员激情讲解(大概率除制服外脖子上还系着领巾如空姐一般),大屏幕上出现各种当地的航拍View,并各种互联网Icon纷至沓来,其空洞和乏味程度,让你怀疑自己在参加一场平庸的婚礼——从主持到视频制作的逻辑都是一样的。好不容易进入到业务演示环节,你发现所谓的大数据系统就是一个政务OA,几台民用级服务器搞定的项目,用的是大几百万的IBM或者富士通,而每年的服务和维护费用可以高达千万以上。

  我见过最蛋疼的一个政府“大数据”项目,是某地的一个水利监测大数据系统,大概就是给当地几个主要的水利枢纽装个摄像头和监测传感器,每天更新当天的水文数据。这事儿我觉得给我十分之一的项目预算,我雇五六个当地老头儿拿了画上标尺的竹竿儿,每天溜达去探几次也就搞定了,估计剩下的钱还够我在北京卖套小小的学区房。

  千万不要因此而鄙视天朝的行政制度,作为这个时代情商水平最高的一个群体,此类项目的政府审批官员们未必不晓得个中奥义,也请不要简单的以灰色交易来看待此类项目,因为现在的反腐形势下,此类政府项目的做法已经不那么简单,背后的博弈套路可以单开一文来细说,此处不表。


   另外一个常见思路,是搞投资人的玩法

  所谓的投资人,其实早已经从以前还算decent的一种职业变成了江湖掮客,靠规则/圈子/信息不对称来骗钱,这个群体目前最大的一个特征就是“不要脸”。当“不要脸”成为从业者的核心能力时,其结果就是拉低整个行业的教育程度和智商门槛。更何况VC行业普遍的2/20结构其实并不一定适合中国的国情,加之监管环境的不严格直接导致了投资人们“体外变现”的动力,这进一步拉低了整个行业的专业水准。简而言之,相当一部分的国内科技领域投资人都存在着知识结构的硬伤,虽然现在拿投资已经是越来越困难的一件事,但是辅以巧妙的设计,“大数据”行业的乡亲们仍然有机会:

  一、一力降十会

  这种打法适合套取来自“土豪”们的资金。一旦发现对方来自国有资本,或者来自一些传统行业的民企(老板早年靠改革东风发财,在制造业/房地产/小煤窑儿走向下坡时寻找转型机会),建议一上来采用这个套路。此类土豪一般都是逆周期者,即往往在某个领域被喊得最热时冲进来当接盘侠,来做洽谈或者尽调的人也大多是“一门没有”的血外行。他们的全部本领就是读了本文开篇列举过的那几本《麻衣神相》,并且学会的一定是其中最最土鳖的部分。在洽谈时要留意听他们使用的词汇,你像“场景”,“革命”,“零到一”,“共享经济”,“风口”,“降维攻击”(作为一个读过一点量子力学的清华人,我觉得这个词太过于sb,在本表格中给予最高权重)….之类,这些词汇如果以平均每三句话出现一次的频率出现时,请记住将你的估值报价加倍。

  具体到大数据这个领域,你只需要强调“大”就可以了,诸如你的系统一天处理多少个TB的数据(放心,他们并不懂得这些数据到底是淘宝的交易数据还是日本动作片),影响了多少人的生活,在某个细分行业里占据了多大的比例,举一个极端的例子:你可以宣称自己在全中国的公共厕所里安装了免费WIFI,根据用户在蹲坑时候刷WIFI的时间判断他是否便秘,从而精准定位到一些潜在的痔疮患者,你的潜在投放客户有“北京市东大肛肠医院”以及“马应龙痔疮膏”等等….细节稍微脑补一下即可,此类“投资人”需要的故事也就这类水平。

  个别的此类低智投资人可能花钱读过EMBA(关于EMBA的梗请参见本人前一篇匿名文章《互联网+拯救不了强哥奶茶的品味》),所以也许他们知道一个叫做SWOT的缺德玩意儿,当他们照本宣科质疑你在公厕里安装WIFI这件事不足以构成竞争门槛时,你可以立刻宣称自己搞定了卫生局和基层掏粪工,这是一个类似于地推能力和政府关系的细活儿,这就是最强大的竞争门槛云云。

  我曾经陪同某此类基金的所谓投资人见识过一个公司,该公司宣称拥有全中国的小店铺数据,而获取数据的门槛就是两轮融资后(也不知道是哪儿的倒霉投资人给的两轮融资,你就是洗钱或串通创始人骗钱也选个靠谱一点儿的啊!)烧钱雇佣几千个兼职大学生去扫街抄取各种路边烟酒店的上货/价签等信息。当创始人把该公司CTO叫来自信满满的给我们演示该公司强大的系统时,我发现这个CTO就是个前端,行业经验目测不满五年,而且,他连什么是Hadoop都不知道...