我一直有一个疑问,我们说大数据,但有些数据明显是真实的,而有些则人为修饰的痕迹太大。 具体来说,比如社交媒体上的信息,它反映了舆情;我们生活中由于物质需求在电商平台上进行交易,订餐,不满意退货,发生纠纷争吵;我们为满足情感和信息发布的需求,发朋友圈,聊天沟通事情;我们的骑行行为、健身行为被记录等等,这些都是习惯与行为的数据产物。 这些都是实打实发生的,当然罗,这里面也有水军,也是一些虚假购买,凡事都有极端。 但我们很多的产业数据,比如农业生产的调查数据,最后形成发布的统计数据,必竟我们不会有原始数据,我们有着再多的数据,其原先的数据都未必是反映真实情况的。 当然包括一些文献数据,我们比如在搜索一些卡脖子技术的时候,查到的绝大部分都是应势文,捧脚文,这些也是有很大的违心成份在内。 这就是我想说的,数据自觉与数据强迫。数据自觉可以支撑大数据,而数据强迫,分析出来的仍是强迫数据。
我一直有一个疑问,我们说大数据,但有些数据明显是真实的,而有些则人为修饰的痕迹太
农度达众伴
2024-12-12 16:46:06
0
阅读:0