![5c112245ea934506ca2aa174f89c0767.png](https://img-blog.csdnimg.cn/img_convert/5c112245ea934506ca2aa174f89c0767.png)
![8dce9d80d7f00e1b4e430f9d35ec3464.png](https://img-blog.csdnimg.cn/img_convert/8dce9d80d7f00e1b4e430f9d35ec3464.png)
GraphPad Prism可谓数据分析表现的小能手,能文能武能统计能画图,那它做统计时如何施展拳脚的,这几天让我们由浅入深的来学习下。
习题
MCF-7细胞过表达MKL-1、STAT3,或MKL-1加上STAT3,检测N-cadherin的相对表达量,pCDNA3.1为对照。
请用合适的统计方法对下列模拟数据进行分析:
![7809e319b0e9ad96fb4be206587b9781.png](https://img-blog.csdnimg.cn/img_convert/7809e319b0e9ad96fb4be206587b9781.png)
再给个示例图提示
![9a9320f310230690815b616359db71e6.png](https://img-blog.csdnimg.cn/img_convert/9a9320f310230690815b616359db71e6.png)
本题示例图来源于文献PMID:28499590;Fig 1A
答案:单因素ANOVA
看结构这只有一个分组的维度,即细胞的处理方式不同,所以在Prism里数据录入的形式应该选择Column。但Prism的方向跟Excel不同,组别分列,样本(或重复测量值)分行,所以在Excel中复制数据后,到Prism里要用“Ctrl+Shift+T
”来粘贴,将数据转个
90º
。组名也是一样的做法。
接下来,多组数据之间的比较,首先想到单因素ANOVA;但要先做正态性检验,若不符合正态分布,则应采用非参数检验。
1) 正态性检验:
点工具栏上的Analyze之后,在弹窗中选择Column statistics,勾选上所有组别。
![b37aea825339894d70d89dcf4f0cd8c7.png](https://img-blog.csdnimg.cn/img_convert/b37aea825339894d70d89dcf4f0cd8c7.png)
点OK之后的弹窗中,把高斯分布(即正态分布)下的三个检验方法都勾上。
简单理解一下这三种方法:当样本量大时,三种方法的结果大同小异;样本量小时,一般只有SW法能计算出结果。至于大小样本的界定,还有不少争议,如30、200、2000为界。没把握就先都选上再看咯。Prism推荐第一种,但第二、三种更常用,SPSS里就是提供后两种的结果。
![4c33af0c25a4ba6c1285ea5f9773d03b.png](https://img-blog.csdnimg.cn/img_convert/4c33af0c25a4ba6c1285ea5f9773d03b.png)
说句题外话,Prism开发组似乎不太喜欢KS法,因为不灵敏,认为它只是个历史情怀。在新版使用说明中讲到:“早期版本我们曾提供KS法,现在还是把它放在这(为了保持一贯性),只是不再推荐。”毫不掩饰的一脸嫌弃.jpg,所以不造将来的版本是否会淘汰它。
本例中N=3,果然只有SW法能出结果,并且很直白地告诉你有没有通过(pass)正态性检验,这里是Yes,符合。
2) 单因素ANOVA
再点一下Analyze,在刚才Column statistics的上方就是one-way ANOVA。同样勾选所有组别。
![bd160ff2cd4331c14c363faa0fb19b0e.png](https://img-blog.csdnimg.cn/img_convert/bd160ff2cd4331c14c363faa0fb19b0e.png)
接下来的弹窗,在第一个选项卡(实验设计)中,本例都是独立样本,所以选第一个,没有匹配。下边是否假设为高斯分布,刚才检验过了,选符合。
Tips:注意区别Prism中使用的两个很容易混淆的词组,replicate values和repeated (或matched、paired) measures。前者可以理解为独立样本,如本文每个实验都重复做至少3次,用分别制备的质粒和细胞,就属于replicate。如果同一份细胞检测处理前和处理后的蛋白表达,则属于时间上有匹配的样本,要选用repeated / matched / paired的相关算法,这个以后会说。
![8e3374306b1a92d099987c19e3a339b1.png](https://img-blog.csdnimg.cn/img_convert/8e3374306b1a92d099987c19e3a339b1.png)
第二个选项卡多重检验,选择各组间如何比较,都跟对照组比还是各组都两两比较,还是跟哪个特定组比。本例就选全都两两比较。
![bdad7a8f4357854b9dd208d7bc69e5ef.png](https://img-blog.csdnimg.cn/img_convert/bdad7a8f4357854b9dd208d7bc69e5ef.png)
但多组的两两比较会增加族错误率,所以要采取一些较正方法,通常用Bonferroni,也可以点开下拉框选择其他,比如Tukey、Sidak。下边控制假阳性率是Prism新增的方法,你也可以试试。
![6e108699398c0c4c7c1eaa83cd79707c.png](https://img-blog.csdnimg.cn/img_convert/6e108699398c0c4c7c1eaa83cd79707c.png)
点OK之后,结果中包含好几个表,先看ANOVA总表。上边的summary中的p值表示这些组是否有统计学差异,但具体在哪组还不知道。
下边的Brown-Forsythe检验即方差齐性检验(若每组都N>5,则还有Barttlet检验)。方差齐也是应用单因素ANOVA的前提之一,不齐则仍需做非参数检验。在SPSS里是要主动勾选是否做方差齐性检验的(用Levene法),而Prism则默默地算好了。
最后一句仍是直白提示,各组标准差没有显著差异,所以是可以继续应用ANOVA的结果的。
![f9872891f0ac442cb9917949f755e8c8.png](https://img-blog.csdnimg.cn/img_convert/f9872891f0ac442cb9917949f755e8c8.png)
所以接下来看下边的多重比较表:
![ceaa9bf869e493b29cf04eef4bf687fa.png](https://img-blog.csdnimg.cn/img_convert/ceaa9bf869e493b29cf04eef4bf687fa.png)
哪组跟哪组比、有没有差异、P值、可以打几个星号之类的细节都有了。这就可以标在图上了。(你问为啥跟示例图不一样?跟你讲了这是模拟数据不是原文数据嘛~)
在图上打标注的方法也很简单,就用工具栏上的画图和文字工具就可以了。
思考题
MCF-7细胞用野生型(WT)和突变型(M)Vimentin promoter的荧光素酶质粒后,再分别进行和上题一样的过表达处理。
请用合适的统计方法对下列模拟数据进行分析:
![a0c2ede0d47a394df0be7584fd0f5539.png](https://img-blog.csdnimg.cn/img_convert/a0c2ede0d47a394df0be7584fd0f5539.png)
示例图还是来自上边那篇文献,PMID:28499590;Fig 2B
答案明天公布
![8ddb10e90f0ca42fdf810c5237c53a38.png](https://img-blog.csdnimg.cn/img_convert/8ddb10e90f0ca42fdf810c5237c53a38.png)
—
END—
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
![ae115701f8939ce77e76a5a83472043d.gif](https://img-blog.csdnimg.cn/img_convert/ae115701f8939ce77e76a5a83472043d.gif)
![5c112245ea934506ca2aa174f89c0767.png](https://img-blog.csdnimg.cn/img_convert/5c112245ea934506ca2aa174f89c0767.png)
![f398fa9ae645d263104db615608ac210.png](https://img-blog.csdnimg.cn/img_convert/f398fa9ae645d263104db615608ac210.png)
点下“在看”,多根头发![5926c1d22242acb07e50585a3df9c8df.gif](https://img-blog.csdnimg.cn/img_convert/5926c1d22242acb07e50585a3df9c8df.gif)