
上QQ阅读APP看书,第一时间看更新
1.3.4 5%的数字数据与95%的非结构化数据
据估计,只有5%的数字数据是结构化的且能适用于传统数据库。如果不接受混乱,剩下95%的非结构化数据都无法被利用,如网页和视频资源。
如何看待使用所有数据和使用部分数据的差别,以及如何选择放松要求并取代严格的精确性,将会让人与世界的沟通产生深刻的影响。随着大数据技术成为日常生活中的一部分,人们应该开始从一个比以前更大更全面的角度来理解事物,也就是说应该将“样本=总体”植入人们的思维中。
相比依赖于小数据和精确性的时代,大数据更强调数据的完整性和混杂性,帮助人们进一步接近事实的真相。当视野局限在可以分析和能够确定的数据上时,人们对世界的整体理解就可能产生偏差和错误。不仅失去了尽力搜集一切数据的动力,也失去了从各个不同角度来观察事物的权利。
大数据要求人们有所改变,人们必须能够接受混乱和不确定性。精确性似乎一直是人们生活的支撑,但认为每个问题只有一个答案的想法是站不住脚的。