标签归档:统计

当我们谈相关分析时我们谈些什么

    不好意思,现在流行用滥标题。

    前段时间崔永元发布了一个赴美采访转基因食品的视频,其中重点采访了一位专家关于草甘膦使用率和肥胖症等疾病发病率之间存在高相关的论据。很快有吐槽贴出来对该论据重点吐槽:相关关系不代表因果关系,相关关系什么都说明不了。

    我也想吐槽:那相关分析就毫无用处干脆不要存在了吗?

    当然不可能,相关分析广泛用于各种数据分析中。它解释不了因果关系,但至少能指出事物之间的关联。

    比如每年冰淇淋的销量和溺水人数存在高相关,虽然冰淇淋不是溺水的原因,但两者都和夏天有关,并非毫无关系。

    比如有机食品的销售和肥胖症发病率有高相关(吐槽贴说的我不知道该命题真伪),很可能是因为有其它因素中介因素,比如有机食品的销售量增加是由人们对健康的忧虑引起的,而对健康的忧虑则和广泛种植转基因食品、疾病率的上升、或者经济状态宽裕有关,而这些因素又可能和疾病有直接联系。

    总之我看不过去抓住相关分析吐槽,相关分析只是提供一个可能性,要推翻这个可能性,最好的方法是提供反证,或者提供更有效的解释因子。

    当然没有原始数据,我不能判断视频里的分析是不是够合理。比如草甘膦的使用率是单纯增加还是有增有减,是不是和任何逐年增加的事物都很容易计算出高相关,和它相关的疾病是不是有致病因的合理解释(目前应该还没有)。

    对于转基因食品本身的风险来说,因为没有人可以为自己的结果买单。比如说政府说有风险结果几十年一百年后发现没问题,那自己多付税金生活费也不会有人还回来。如果政府说没风险结果几十年一百年后发现有问题,也不可能时光倒转。关于风险问题,我个人认为不可能是零,看你怎么评价它和自己如果回避风险要付出的代价吧。关于知情权,如果可能的话作为个体我是希望拥有的,但是肯定得有代价,比如更多的公共支出和相应的经济负担。

    另外,吐槽贴里拿食品过敏来比较,真是太让人看不过去,忍不住一声大吼了。别置换话题好不好!一些敏感人群对某些食品过敏,不代表这些食品不安全。的确是这样,但这有前提:过敏源可以特定并且在生活中排除,要不然就算是再熟悉的大众化的食品也应该定性为不安全。比如某些药物对于某些人来说副作用很大,但对于大部分人来说有正常疗效,说如果没办法预先知道哪种体质会有致命反应的话,这种药物恐怕不能被广泛使用。

    写完以后觉得自己真啰嗦。

The file drawer effect

from Wikipedia

写论文上关于哪些写,哪些不写的问题,其实研究伦理上规定得并不严格,很多都是作者自行判断。所以那些不好的或者不显著的成果往往都沉眠在抽屉之中,也许就只有刚好那5%显著的结果被发表出来也说不定。哎哎,这么说还真是自己给自己找堵啊。

The file drawer effect, or file drawer problem, is that many studies in a given area of research may be conducted but never reported, and those that are not reported may on average report different results from those that are reported. An extreme scenario is that a given null hypothesis of interest is in fact true, i.e. the association being studied does not exist, but the 5% of studies that by chance show a statistically significant result are published, while the remaining 95% where the null hypothesis was not rejected languish in researchers’ file drawers. Even a small number of studies lost “in the file drawer” can result in a significant bias.[5].

The term was coined by the psychologist Robert Rosenthal in 1979.[6]

Go不Google剧情上的性别差异

截止至2009年11月14日,投票人数达到33人,其中男9名,女22名,未计入性别2名。更新的结果和统计分析结果如下。样本增大后发现,在这点上似乎并没有什么性别差。不过要得出可靠的结论,我觉得至少一两百人的样本吧。

假说为“在go不google剧情上男女有别”时,使用two-tailed test,p = .13,n.s.

假说为“女人更喜欢google剧情”时,使用one-tailed test, p = .11,n.s.

是否google剧情的结果2


[OLD]
昨天就 听故事的顺序 码了几句,目前投票人数为28,其中男7名,女19名,未记入性别2名。未计入性别的两票分别为1票go(念“gu”一声),1票不go。记入了性别投票结果为下图,使用“Fisher’s exact test”做了统计分析。

假说为“在go不google剧情上男女有别”时,使用two-tailed test,p = .073,只是有意倾向。

假说为“女人更喜欢google剧情”时,使用one-tailed test, p = .037,significant。

是否google剧情的问卷结果

我得记录一下今晚干了些什么

    今天晚上就Tukey’s HSD test google了4个多小时,终于搞明白之后,是几秒的成就感,然后接下来就是几分钟的自责:我咋那么笨啊,早该想到了。

    起因是下午收到老板的一封email,老板说,温桑,我在读你的论文原稿,这次比上一个版本好了很多。有个问题,四个条件之间做比较时,你用的是Tukey的HSD法,这个方法不是要预先确定α值的吗?怎么你会得出不同的p值(有的是p<.05,有的是p<.10)?你用什么方法算的?     我的脑袋立马嗡了一声,因为我其实很害怕这个老板。去年刚投靠他时觉得他还蛮温和的,时间越长越发现他的可怕,最近见面的时候他的脸拉得下巴都可以碰地板了,所以我很有心理阴影。看到这封email,我一下子也回答不上来,我只知道统计软件一按按钮就输出了一堆p值,改α值也是没变化的。但我可不敢这么回答。     于是我查了一本古老的教科书,上面介绍的HSD法的计算是,用一个公式先算出一个HSD的临界值,然后用别的条件间的差去和临界值比较,就知道先不显著了。算这个临界值的确是需要先确定α的。那统计软件的p值究竟是啥玩艺呢?     于是卡在这个问题上原地google了4小时,在那个 「統計学関連なんでもあり」掲示板へ Go! 的网站上打捞了n久,连个毛都没捞到。最后我终于放弃了日文google,用中文google了一下,瞬间发现google图书上有好多好多统计书可以查。这本 量化研究與統計分析: SPSS中文視窗版資料分析範例解析(基礎版) (为啥日文google不蹦几本google图书出来呢!)突然让我茅塞顿开,用统计软件要α做个球啊!Tukey的HSD法的原理不是q分布嘛,手算的时候才需要按照α去查这个分布的显著的临界值啦,软件的话当然直接算q值然后给你把p输出来……流泪了,答案简单得和t分析没什么不同。我败在了老板的威慑力和对多重比较的恐惧心上……

    这就是我今天晚上做的事情。。。