欢迎进入大数据时代。薛定锷在他的《生命是什么》一书中提到有机体的根号N定律,它是一个关于物理学定律的不准确度的期望值。薛定锷举了气体压力,温度和密度的关系测量,假设N为气体分子的个数,那么测量的相对误差就是根号N的量级。薛定锷得出一个推测或者结论,一个有机体为了使它的内在生命以及它同外部世界的相互作用都能为精确的定律所描述,它就必须有一个相当巨大的结构。不然的话,参与合作的粒子数太少了,“定律”也就不太准确了。如果这个N是一百万,误差就会有千分之一。如果是一亿,精确性就提高到99.999%。这个也叫大数定律。海量数据时代扩大了那个N,计算机的处理能力对于更大的N都不在话下,大数据处理提高了结果的准确性,大数据中部分数据的不精确,错误并不影响数据整体处理的结果。Garbage in 不再 Garbage out了,因为数据量足够大了。