数据资产论

王汉生
前言 人们都说,这是一个大数据时代,是数据产生价值的时代,更是数据成为资产的时代。真的是这样吗? 要认真探讨这个问题并不容易。首先,要理解什么是数据。对于数据,可以给出多种不同的定义,各有其道理。但是,哪种定义能够帮助我们更好地理解数据产业?理解它的昨天,今天,还有明天呢?其次,要理解什么是资产。会计学对资产的定义是什么?数据就是资产,这个说法站得住脚吗?根据会计学的定义,资源要成为资产有一个必要条件:带来预期的经济收益。那么什么是经济收益?我认为就是商业价值。由此可见,不是所有的数据都可以称为资产,只有那些能够产生商业价值的数据才可以称为资产。因此,数据创造价值的过程,就是数据资源资产化的伟大历程! 数据如何产生价值?纯粹而孤立的数据有商业价值吗?没有。数据价值的彰显需要一个必要条件:业务场景。只有合适的数据配合合适的业务场景,才能产生价值。业务场景可以孤立于数据之外而产生价值,但是数据却无法孤立于业务场景之外产生价值。因此,数据价值之道在于:场景为王,数据次之,算法最后。所以,数据分析的第一步,也是最重要的一步,不是分析数据,不是建立模型,而是分析业务。对业务缺乏充分的理解,不可能让数据产生价值。为此,需要一套规范的方法论,帮助我们从业务角度定义数据分析,从数据分析角度实践业务。这就需要具备一种能力,即把抽象的业务问题转变为数据可分析问题。这是数据分析最困难、最具挑战也是最了不起的地方。为此,你需要重新理解:什么是回归分析。 人们通过各种数据建模的技术手段,对业务的核心指标做出预测,希望可以无限准确。但悲催地发现,无论如何努力都无法做到非常高的预测精度。你可能开始怀疑人生,变得焦虑、苦恼、迷失方向。其实不必慌张,这一切都很正常,这才是数据分析的真实世界。对真实的数据分析而言,预测不准是常态,预测过度准确才是一个让人非常担忧的“变态”。为什么?因为预测过度准确常常是一个…