所以这其中存在因果关系。断言:“好吧,如果你吸烟,并且发生了 X、Y 和 Z,那么你就会生病。” 模拟只能重现经过我们能力过滤的世界。如果我将数据输入系统,计算机不会中途停下来并告诉我:“嘿,你缺少一些变量,所以我无法运行模拟。”它只会输出底层模型的自然结果。 因此,在模拟复杂系统时,我们必须解决的第一个问题是准确评估哪些变量最为重要。
例如,文化适应,即我们的思想受到我们所消费的媒体影奥地利资源响的过程,只能解释态度变化的 6%。即使把家里的所有电视都搬走,我们仍然有高达 94% 的差异没有得到解释。 数据足够吗? COVID 是模拟可能严重失败的另一个很好的例子。在疫情爆发的最初几周,一些模拟估计死亡率至少为 10%。每十个感染者中就会有一个死亡。幸运的是,事实并非如此,但为什么科学家们的预测偏差如此之大呢? 因为当时我们几乎没有关于这种疾病的任何数据,而且我们所掌握的数据也存在严重偏差。
样本来自医院,大多数人一开始就避免去医院,因为医院人满为患。所以我们对患有肺部并发症并有风险的人进行了过度采样。 我永远不会厌倦说:模型的好坏取决于它所基于的数据。对于复杂系统,我们必须解决无数问题:非结构化数据、有偏差的样本、缺失数据和未校准的设备只是其中最常见的一些。 看看三项关于幸福感的不同社会学研究,你会发现结果有很大差异。