差异分析

文献引用:Bioinformatic analysis was performed using the OECloud tools at https://cloud.oebiotech.com.
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
本工具为差异分析,旨在找出不同样本间的差异表达情况。
利用R中的DESeq或DESeq2包对各个样本的counts 数目进行标准化处理(采用BaseMean值来估算表达量),计算差异倍数,并采用NB(负二项分布检验的方式)对reads数进行差异显著性检验。
筛选标准:其一,FoldChange,即两样本中同一个基因表达水平的变化倍数;其二,pValue或qValue(adjusted pValue),qValue值的计算方法先要对每个基因进行 pValue 的计算,再用 FDR 错误控制法对 pValue 作多重假设检验校正。默认筛选差异的条件为 p<0.05 且差异倍数≥2。

参数调整

注:报告中会提供counts文件,如全转项目中,文件夹“1.3.mRNA_expression”中包含的 counts_anno.xls
注:需从页面右边的示例文件中下载填写,diff_DEG_group.xlsx
选择使用p值或者q值进行差异筛选,默认为q值
通常使用0.05
通常使用2,必须大于0
测序数据类型,下拉选择
注:报告中会提供表达量文件,如全转项目中,文件夹“1.3.mRNA_expression”中包含的 fpkm_anno.xls
字体类型,默认"Arial"
字体样式,默认"无"
用于结果的自定义标记
提交 重置

结果与说明

任务正在排队中,目前后台全部排队数量:

当前任务运行预计需要耗时

程序正在运行中,预计需要耗时

{{ m.content }}

程序运行出错,报错信息如下:

    1. 输入counts文件

    counts文件为必填参数,第一列为基因名称,其余各列为各样品中相应counts数目。

counts_table.png


    demo数据下载1:counts_anno.xls  (附件中注释信息可以保留,不影响差异分析)

    demo数据下载2:counts.xls


    2.差异分组文件

    差异分组文件为必填参数;必须按照示例样式填写,支持多个差异分组同时分析。

    case列:实验组样本,多个样本时请以英文逗号分隔

    case_name列:实验组组名

    control列:对照组样本,多个样本时请以英文逗号分隔

    control_name列:对照组组名

    replicate列:如有生物学重复,填写yes,无则no

    paired列:如为配对样本,则填yes,非配对为no;注意如果为配对分析,实验组对照组样本顺序必须一一对应且数目相等,最后一列差异分析方法必须用DESeq2

    method列:差异分析方法,可以为DESeq或DESeq2


deg_group.png

demo数据下载:diff_DEG_group.xlsx


 

   3. 输入表达值矩阵

    第一列为基因名称,其余各列为各样品中相应表达量。

fpkm_table.png

    demo数据下载1:fpkm_anno.xls (附件中注释信息可以保留,不影响差异分析)

    demo数据下载2:fpkm.xls




    1.差异热图

    每个差异分组均分别生成一张热图(注:绘制差异热图必须提供表达量文件,结果仅保存为pdf格式,故未显示在网页页面上,可从结果文件中下载获取)。

热图示例.png



    2.差异统计条形图

    多个分组时会同时展示在一张图中。


    3.差异火山图

    每个差异分组均分别生成一张火山图。

火山图.png


    4.差异未筛选文件

    如:A-vs-B-all.gene.xls。


    5.差异筛选文件

    如:A-vs-B-diff-pval-0.05-FC-2.gene.xls。


    (1) 请按照使用说明样式整理差异分组文件,多个样品名称以英文逗号分隔

    (2) 输入数据矩阵中不允许存在重复基因,分析过程中程序将删除对应基因数据;

    (3) counts文件中必须存在在所有样本中表达量均大于0的基因,不然deseq无法运行。

版本更新日期更新内容
v2.3.02021.09.15修改文件读取函数;差异分析函数添加组内count均值过滤阈值;run_DESeq2_paired函数列名问题;添加检查样本名称机制;添加检查差异分组文件相关代码。
v2.2.02021.09.01
v2.1.12021.07.28修改日期基因匹配规则
v2.1.02021.06.25添加字体参数调整输出数据表头,修改图形样式
v2.0.12020.12.25支持无表达量文件进行差异分析;图片字体修改;捕获文件格式错误信息并输出中文报错
v1.3.52020.09.15兼容txt,xls,xlsx,csv等多种文件格式输入
v1.3.42020.08.15添加差异热图,火山图,条形图,删除样本数量参数
v2.3.22020.07.12修复上传xls的bug
v2.3.32020.09.29优化部分bug
v2.3.52020.10.26优化部分行名冲突,颜色空白问题