一、 行业现状:数据源价值有限、扎深垂直行业必然面临、跨场景挑战
崔晓波:先看现状,市场上主要由四类公司构成。第一类是做数据相关的软件的企业,这类公司在中国非常难以成功,因为周期非常长,基本上是八到十年,客户、产品以及渠道体系沉淀到一定的阶段才有可能爆发。
这在中国资本市场是不支持的,因为早期的专注于做技术或者软件的企业没有退出路径,美国哪怕是研发最强的公司,谷歌,IBM每年要做大大小小几十个并购,中国的公司基本上没有这个习惯。前两天欣喜的看到阿里总算买了一家德国的公司,我希望这是一个好的开始,否则中国的软件公司非常难。
创新的源头不在中国,全在美国,不管是开源的框架还是最新的科技,出处基本上都在硅谷,中国的企业基本上是跟随,周期太长,资本市场不支持。
现在大量的企业由于软件非常难做,企业又相对来说不太认可软件创造的价值,只是所谓增效或者节省成本,在经济周期里企业很难接受这个价值。
大量公司转型上去做服务,也就是解决方案,这类企业真正的议价是靠品牌。有两类公司占有优势,第一类是大的咨询公司,比如像麦肯锡,人均产能一年能到百万级,还是很赚钱的。
如果一旦做不到人均产出,很难养活自己,最后公司扩展非常难,大量人力要分布到低成本的城市群去挤利润。
这两类公司我们也做过研究,我们把一级市场,二级市场里,包括创业板、A股上市的科技类公司大概几百家分析了一遍,发现一个有趣的现象。
第一,年净利润超过15亿的公司只有两家,其中一家,也是转型做服务。第二,年净利润在科技股里5-15亿区间的企业是0家,大家认知的大的软件公司年净利润都在5亿以下,为什么?因为都是很苦的生意,这点利润是靠节省人力出来的。
到了数据时代又产生两类公司,一类公司是数据源公司,一类是数据应用公司。
数据源公司,一类是独占数据源公司,一般拥有独家代理权,这类企业是有利润的,营收区间4-6个亿,利润区间1个亿左右,但是天花板很明显,因为数据是原材料,单纯的卖原材料其实是没什么价值的,并没有在这个数据之上产生竞争力强的服务。
另一类公司更像数据的搬运工,大量采购数据,然后做模型比如卖给金融企业做风控模型、反欺诈模型、清算模型等,这类企业通常有收入没有利润,现在中国整个数据应用属于第一阶段,基本上体现的是数据的价值,没有到模型产生大量价值,所以增值价值很小。
这类企业未来三到五年会碰到很大的挑战。第一是国家的监管趋严,单纯靠卖源数据,甚至涉及隐私数据非常难。第二,由于数据只是原材料,而且随着数据源越来越多,价值会不断被摊薄。
另一类数据运用公司,数据应用的核心壁垒数据模型,依靠模型不断贡献数据,如黑名单类业务,调模型时能不断产生数据,使壁垒增加,这类公司盈利状况好一些。
近两年大数据公司普遍碰到问题是,深入了行业和场景后很难跨领域。一旦深入某个场景,所有的人员储备,甚至公司的基因都往那个方向偏。比如说这两年国家重点整治互金,去杠杆就特别难,受行业影响特别大,政策性和行业性的风险比较大。目前我们看到在大数据领域从业的四类公司都是这样的。
回到这里,应运而生数据中台的概念,数据中台就是帮助企业解决这个问题。而当下资本环境收缩现状下,大家开始纷纷开始聚焦,技术基因的公司开始专注数据平台,业务基因的专注业务。
二、 商业模式:数据+技术+场景+流量缺一不可
崔晓波:回答第二个问题,大数据的商业模式到底是什么,现在绝大部分投资不知道大数据公司怎么赚钱,我只能解释一下,如果你做数据平台或者做中台,基本上需要四个方面的能力,缺一不可,分别是数据、科技、流量、场景。
中国的业务和美国不同,作为2B的数据企业,去赋能传统行业时,发现单纯的技术解决不了他的问题,他要的也不仅仅是数据,往往要涉及到流量,要帮他解决获客的问题,卖东西的问题,才有可能和这个客户形成一个比较紧密的合作;要深入场景,要产生业务价值,帮他多产生一些收入,你的价格才会更高一些。
这四个要素放在一起,好像只有大公司能干,在中国未来会产生组合,产生联盟,产生各种主权关系。
2B的企业本质上就赚三种钱,一种是IT,中国市场本身就比美国小,公司都挤在这儿了。二是营销预算,如果对流量没有控制,第三,再往上的钱是最多的,能够分到客户业务的流水。
数据公司会在这个地方更赚钱,因为力量很强大,但同时可以不承担风险。换句话说,我认为好的开源模式应该分到这三种钱,但产品模式是单一的。
前面是简单讲下逻辑,现在我们认为最终整个大数据公司的商业模型不止是卖数据和卖科技,这两个最终是能力,不是商业模式,最终的商业模式是要驱动营销,驱动业务场景,而且在里面要分到钱,不是按成本计价才能做。
三、 数据中台:数据共享开放的关键是“连接”
崔晓波:回到数据中台,由于寒冬来了,大家突然发现每家公司真的需要共享平台解决一些共性问题,否则成本降不下来,都在重复造轮子。
基本的能力第一是数据聚合能力,举个例子,比如说现在我们和运营商、电商,和京东、腾讯得有数据连接能力,这种连接能力不是一般的连接能力,而且是连接,不是拥有。
以前大企业做大数据项目喜欢建立一个集中的数据平台,大数据时代这样做不太可能,因为成本代价非常高,大家更多采用的方式是靠数据连接。
但是这种连接要求是合法合规的,最近出现不管是隐私问题,还是数据安全问题,本质都是由于数据连接不合规带来的。因为真正使用这些数据模型的时候,传入的很多参数是敏感数据,手机号、身份证、银行卡号等,要把所有ID数据脱敏,而且要和数据供应商做协调,在那要解决合规和连接问题。
总体思路是数据不动,让算法流动解决大的数据共享以及联合建模的问题,所以现在我们已经提供了大量安全环境,大家可以把数据混合在一个安全箱子里,谁也拿不走,可以在里面跑模型。
其实只有一个关键词能评估中台数据流量,就是你的共享能力到底有多强。市场有大量的需求,不愿意和每个数据源去连,他们担负着很大的风险,同时他们希望这个平台能够提供统一的科技能力,让他们能够在这个平台上加工数据,输出数据,这是我们看到的数据中台的核心,安全、连接、共享。
此外,所有接入我们的数据提供商都能获得全局的数据应用,所有的标签和数据描述。
最后,数据科学平台就是一个模型探索平台,包括对后面模型的生命周期的管理,我们还得集成海外合作伙伴的能力,利用海外顶尖的科技服务中国的开发者,这些是我们理解的数据中台必要的连接能力。
最后我还想谈一下感受,其实我们最后发现,特别是在寒冬底下,每一个团队,每一个客户在自己领域里好像都在做博弈,真正发挥数据的力量更多是跨界,包括我们做了很多跨界的尝试,我们发现跨界的力量还是很大的,能够产生不一样的商业模式以及不一样的合作模式,你会发现商业模式完全不同,带来的回报是原来的几倍,更多我们觉得基于数据场景的突破口,是基于各种场景做跨界的突破,这样才有可能产生新的基于数据的价值。