数据最神奇的力量开始于预测比赛、后盛行于预测美国总统选举,这是数据史上曾经发生过的真实一幕。随着数据作为生产要素进入市场,数据几乎成了数字化的主宰。没有数据的数字化,根本很难想象会是什么样的。在数字化红利当中,数据就是王者。究其原因就是我们对数据的求真与现实数据的失真之间的矛盾所决定的。越是现实数据失真的厉害,我们对于数据的求真就越迫切,拥有真数据的价值就越高。这使得我们不仅要问,现实数据为什么会失真呢?或许导致现实数据失真的原因有很多,我们这里总结几个:

1)多与用的矛盾。信息似乎铺天盖地、到处都是,但是可用的信息却寥寥无几。

2)主观与客观,全面与片面的矛盾。我们总是习惯主观地、有选择地看待了数据和信息还不觉得。

3)信息与知识的矛盾。我们总是自以为自己需要的是信息,但其实真正需要的是知识。从数据信息再到知识,每一步都受认识规律的支配,每一步都有一个巨大的鸿沟需要跨越。

与此同时,数据失真使得我们对数据十分依赖,引发我们在使用数据、分析数据上另一个失真的存在。比如,我们在使用数据、分析数据时,想直接从数据中找到因果关系,过于强调直接的因果性,使得模型中缺少变量。

另外,数据到处理步骤时,数据几乎已是历史数据,现实的情况实际已经发生了实质性的改变。我们还以固化的思维,依赖历史数据,却忘记了还要依赖于现实的当下。这是几乎所有大数据失效的根本所在。另一方面,即使数据是时效分析的,人的适应性和灵活性,都会使得任何事物的数据在现实面前失效,凡事基于数据的经验或结论,都会被人在针对性预防、操纵中令其失效,这是人性。这使得那些认为大数据的作用是让历史告诉未来的人,深伤其心,不再相信数据,从而不得不发出一个普遍的疑问,数据真的可靠吗?数据真的能为王吗?

其实数据能不能为王,不是绝对的。持静态观念的人,在实践中会对数据为王产生深深的不再相信。持动态观念的人,会在数据为王中不断地寻求进步。他们会在数据之中,不断地加入情境,比如行为、社交、兴趣、个人、环境等变量,在这些变量中去使用数据,给数据新的意义和价值。这或许便是数据为王之道。单纯的数据,产生不了王者,因为那不是道之所在。这使得我们在进行数字化建设时,不得不考虑数据与情境的配合,考虑什么场景下的数据和可使用的场景。这或许就是数据和人本身配合的需要。