差异分析

搜索
开发者:yyq  |  更新于1 周,1 日前  |  浏览量 2645

文献引用:Bioinformatic analysis was performed using the OECloud tools at https://cloud.oebiotech.cn.
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
本工具为差异分析,旨在找出不同样本间的差异表达情况。
利用R中的DESeq或DESeq2包对各个样本的counts 数目进行标准化处理(采用BaseMean值来估算表达量),计算差异倍数,并采用NB(负二项分布检验的方式)对reads数进行差异显著性检验。
筛选标准:其一,FoldChange,即两样本中同一个基因表达水平的变化倍数;其二,pValue或qValue(adjusted pValue),qValue值的计算方法先要对每个基因进行 pValue 的计算,再用 FDR 错误控制法对 pValue 作多重假设检验校正。默认筛选差异的条件为 p<0.05 且差异倍数≥2。

参数信息
  1. 注:报告中会提供counts文件,如全转项目中,文件夹“1.3.mRNA_expression”中包含的 counts_anno.xls
  2. 注:需从页面右边的示例文件中下载填写,diff_DEG_group.xlsx
    选择使用p值或者q值进行差异筛选,默认为q值
  3. 通常使用0.05
  4. 通常使用2,必须大于0
    测序数据类型,下拉选择

查看更多非必选参数

  1. 注:报告中会提供表达量文件,如全转项目中,文件夹“1.3.mRNA_expression”中包含的 fpkm_anno.xls
    字体类型,默认"Arial"
    字体样式,默认"无"
相关数据
  • 使用说明
  • 结果说明
  • 重要提示
  • 版本信息
  • 操作视频
    1. 1. 输入counts文件

        counts文件为必填参数,第一列为基因名称,其余各列为各样品中相应counts数目。

    counts_table.png


        demo数据下载1:counts_anno.xls  (附件中注释信息可以保留,不影响差异分析)

        demo数据下载2:counts.xls


    1. 2.差异分组文件

        差异分组文件为必填参数;必须按照示例样式填写,支持多个差异分组同时分析。

        case列:实验组样本,多个样本时请以英文逗号分隔

        case_name列:实验组组名

        control列:对照组样本,多个样本时请以英文逗号分隔

        control_name列:对照组组名

        replicate列:如有生物学重复,填写yes,无则no

        paired列:如为配对样本,则填yes,非配对为no;注意如果为配对分析,实验组对照组样本顺序必须一一对应且数目相等,最后一列差异分析方法必须用DESeq2

        method列:差异分析方法,可以为DESeq或DESeq2


    deg_group.png


        demo数据下载:diff_DEG_group.xlsx


    1. 3. 输入表达值矩阵

        第一列为基因名称,其余各列为各样品中相应表达量。

    fpkm_table.png


        demo数据下载1:fpkm_anno.xls (附件中注释信息可以保留,不影响差异分析)

        demo数据下载2:fpkm.xls





    1. 1.差异热图

        每个差异分组均分别生成一张热图(注:绘制差异热图必须提供表达量文件,结果仅保存为pdf格式,故未显示在网页页面上,可从结果文件中下载获取)。

    热图示例.png


    1. 2.差异统计条形图

        多个分组时会同时展示在一张图中。


    1. 3.差异火山图

        每个差异分组均分别生成一张火山图。

    火山图.png


    1. 4.差异未筛选文件

        如:A-vs-B-all.gene.xls。


    1. 5.差异筛选文件

        如:A-vs-B-diff-pval-0.05-FC-2.gene.xls。


    1.  (1) 请按照使用说明样式整理差异分组文件,多个样品名称以英文逗号分隔


    2.  (2) 输入数据矩阵中不允许存在重复基因,分析过程中程序将删除对应基因数据;


  • 版本更新日期更新内容
    v2.3.02021.09.15修改文件读取函数;差异分析函数添加组内count均值过滤阈值;run_DESeq2_paired函数列名问题;添加检查样本名称机制;添加检查差异分组文件相关代码。
    v2.2.02021.09.01
    v2.1.12021.07.28修改日期基因匹配规则
    v2.1.02021.06.25添加字体参数调整输出数据表头,修改图形样式
    v2.0.12020.12.25支持无表达量文件进行差异分析;图片字体修改;捕获文件格式错误信息并输出中文报错
    v1.3.52020.09.15兼容txt,xls,xlsx,csv等多种文件格式输入
    v1.3.42020.08.15添加差异热图,火山图,条形图,删除样本数量参数


  • 问题反馈