当我们谈相关分析时我们谈些什么

    不好意思,现在流行用滥标题。

    前段时间崔永元发布了一个赴美采访转基因食品的视频,其中重点采访了一位专家关于草甘膦使用率和肥胖症等疾病发病率之间存在高相关的论据。很快有吐槽贴出来对该论据重点吐槽:相关关系不代表因果关系,相关关系什么都说明不了。

    我也想吐槽:那相关分析就毫无用处干脆不要存在了吗?

    当然不可能,相关分析广泛用于各种数据分析中。它解释不了因果关系,但至少能指出事物之间的关联。

    比如每年冰淇淋的销量和溺水人数存在高相关,虽然冰淇淋不是溺水的原因,但两者都和夏天有关,并非毫无关系。

    比如有机食品的销售和肥胖症发病率有高相关(吐槽贴说的我不知道该命题真伪),很可能是因为有其它因素中介因素,比如有机食品的销售量增加是由人们对健康的忧虑引起的,而对健康的忧虑则和广泛种植转基因食品、疾病率的上升、或者经济状态宽裕有关,而这些因素又可能和疾病有直接联系。

    总之我看不过去抓住相关分析吐槽,相关分析只是提供一个可能性,要推翻这个可能性,最好的方法是提供反证,或者提供更有效的解释因子。

    当然没有原始数据,我不能判断视频里的分析是不是够合理。比如草甘膦的使用率是单纯增加还是有增有减,是不是和任何逐年增加的事物都很容易计算出高相关,和它相关的疾病是不是有致病因的合理解释(目前应该还没有)。

    对于转基因食品本身的风险来说,因为没有人可以为自己的结果买单。比如说政府说有风险结果几十年一百年后发现没问题,那自己多付税金生活费也不会有人还回来。如果政府说没风险结果几十年一百年后发现有问题,也不可能时光倒转。关于风险问题,我个人认为不可能是零,看你怎么评价它和自己如果回避风险要付出的代价吧。关于知情权,如果可能的话作为个体我是希望拥有的,但是肯定得有代价,比如更多的公共支出和相应的经济负担。

    另外,吐槽贴里拿食品过敏来比较,真是太让人看不过去,忍不住一声大吼了。别置换话题好不好!一些敏感人群对某些食品过敏,不代表这些食品不安全。的确是这样,但这有前提:过敏源可以特定并且在生活中排除,要不然就算是再熟悉的大众化的食品也应该定性为不安全。比如某些药物对于某些人来说副作用很大,但对于大部分人来说有正常疗效,说如果没办法预先知道哪种体质会有致命反应的话,这种药物恐怕不能被广泛使用。

    写完以后觉得自己真啰嗦。