富集分析

文献引用:Bioinformatic analysis was performed using the OECloud tools at https://cloud.oebiotech.com.
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
该工具功能包括GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)的富集分析。
GO:
其中Gene Ontology(GO)数据库提供了专业的术语来定义基因产物的属性。它包含三大类:生物学过程(Biological Process,BP)表示一个分子活动事件的过程,包括细胞、组织、器官和物种的功能集合,往往也是和实验研究问题关联程度最高的一类;细胞组分(Cellular Component,CC)表示细胞或其所处的外界环境;分子功能(Molecular Function,MF)是描述在分子水平上基因产物的活性元件。
KEGG:
Kyoto Encyclopedia of Genes and Genomes (KEGG)是系统分析基因功能,联系基因组信息和功能信息的数据库。
该小工具除了支持人、大鼠和小鼠物种外还支持对含有背景文件的物种进行富集分析。

参数调整

注:下拉选择物种,选项中没有的物种选择“其他物种”,并在更多参数中上传对应的背景文件
注:粘贴GeneID,此参数与差异基因表,二选一即可.
注:转录组分析报告中的差异基因表可以直接进行分析,当选择此参数时,基因ID不要填写。文件名称例如:A-vs-D-diff-q-val-0.05-FC-2.0.gene.xls
注:选择其他物种,需要上传GO背景文件
注:选择其他物种,需要上传KEGG背景文件
注:选择其他物种,需要上传KEGG注释文件
注:当选择其他物种,如使用除KEGG和GO外的数据库,此项为必填项。
用于结果的自定义标记
提交 重置

结果与说明

任务正在排队中,目前后台全部排队数量:

当前任务运行预计需要耗时

程序正在运行中,预计需要耗时

{{ m.content }}

程序运行出错,报错信息如下:

1、使用说明

    1.使用方法1—— 选择物种(下拉选项中的物种示例)

    (1)选择物种

     选择人、小鼠、大鼠 、拟南芥、大豆、水稻、酵母、线虫、家蚕、斑马鱼、猪、牛、山羊、羊、家兔、小麦、玉米、烟草

    (2)基因ID

     直接输入GeneID,或在excel中复制gene_id并粘贴到文本框中。

    (3)差异基因表

     转录组报告中某个比较分组下的差异基因表,比如: \result\1.4different_expressed_gene\*-vs-*\*-vs-*-diff-q-val-0.05-FC-2.gene.xls 

如果差异基因表的格式不为*-vs-*diff-*.xls格式,在运行的过程中可能会缺少结果,这里的文件命名格式为组1-vs组2-diff-q-val-0.05.xls.请注意这里的上下调必须为Up和Down,否则流程不识别。

gene_idFoldChangelog2FoldChangep-valueq-valueRegulation
GJD2110.306.78530.0000020.008Up
MME9.50453.2489.49E-080.0005Up
RPL30.2793-1.83986.84E-060.01Down

demo示例文件:A-vs-D-diff-q-val-0.05-FC-2.0.gene.xls


2.使用方法2——选择物种(其他物种示例)

    (1)选择物种:勾选"其他物种"

    (2)GO和KEGG背景文件

         第一列为基因名称,第二列为Term名称,多个以英文逗号分割,第三列为Term描述,多个以中竖线分割(|)。

         GO背景文件示例:(上传背景文件中不能有标题)

gene_name
go_termgo_description
DCUN1D1
GO:0000151,GO:0005515
ubiquitin ligase complex|protein binding
MMP14
GO:0001501,GO:0001525
skeletal system development|angiogenesis
PGA3
GO:0004190,GO:0006508
aspartic-type endopeptidase activity|proteolysis

    demo数据下载:gene_go.backgroud.xls(人)


        KEGG背景文件示例:(上传背景文件中不能有标题)

gene_namepathway
pathway_description
MMP14hsa04668,hsa04912TNF signaling pathway|GnRH signaling pathway
PGA3hsa04974Protein digestion and absorption
MMP15hsa04928Parathyroid hormone synthesis, secretion and action

demo数据下载:gene_kegg.backgroud.xls(人)


        KEGG注释文件示例:(上传背景文件中不能有标题)

gene_namegene_id
pathway
MMP144323hsa04668,hsa04912,hsa04928
PGA3643834hsa04974
MMP154324hsa04928

demo数据下载:gene_anno-kegg.backgroud.xls(人)


3.使用方法3——使用非GO和KEGG数据库进行富集分析

        (1)选择物种:勾选"其他物种"
        (2)"是否使用非GO和KEGG数据库进行富集分析" 项:勾选"是"
        (3)富集分析背景文件:格式与GO或KEGG的背景文件一致
        (4)数据库名称:结果文件中使用的名称

        以wikipathway数据库为例,进行整理数据库所需的背景文件。(上传背景文件中不能有标题)

gene_name
wikipathway
wikipathway_description
GAS6WP5090,WP4217,WP4806Complement system in neuronal development and plasticity|Ebola virus infection in host|EGFR tyrosine kinase inhibitor resistance
GAS8WP4803Ciliopathies
GATA1WP2849,WP4754Hematopoietic stem cell differentiation|IL-18 signaling pathway

demo数据下载:gene_wikipathways.backgroud.xls(人)



    二、结果说明

    选择默认的人、大小鼠物种,最后分析结果会附带REACTOME和Wikipathway的分析结果,除此以外的其他物种没有这两类结果。如果想分析其他物种的REACTOME和Wikipathway富集分析结果,请按照选择其他物种进行分析。


目录第一层级
目录第二层级文件文件描述
1.GO_enrichmentenrichment_go.xls--
GO上调、下调、总和的注释统计
分组1_分组2
*.level2.xls/pnglevel2水平的统计和条形图结果
2.KEGG_enrichmentenrichment_kegg.xls--
KEGG上调、下调、总和的注释统计
分组1_分组2
*.Classification.xls/pngKEGG分类图结果,包括条形图、气泡图、和弦图
3.KEGG_map分组1_分组2*.html和*.png
KEGG差异基因通路图
4.Reactome_enrichment--
*.xls和*.png
REACTOME富集分析结果文件夹,包含统计表、气泡图、和弦图
5.WikiPathways_enrichment--
*.xls和*.pngWikipathway富集分析结果文件夹,包含统计表、气泡图、和弦图


2.1 GO分析结果


结果示例图1 GO条形图



GO.chord.top.Down_00.png

enrichment-kegg-A-vs-D-Total.circos_00.png

    


   2.2 KEGG分析结果


结果示例图2 KEGG分类条形图和气泡图


        KEGG通路图


结果示例图3 KEGG通路图


hsa04540.png


2.3 REACTOME分析结果


结果示例图4 REACTOME下调基因气泡图


Reactome.top.Down.png


2.4Wikipathway分析结果


结果示例图5 Wikipathway上调基因气泡图


WikiPathways.top.Up.png



3、重要提示

    (1)选择物种

        选择物种有18个物种可以选择,目前仅支持现有的物种进行分析,如果想要分析其他物种,如果想要分析GO和KEGG,请上传对应的GO背景文件、KEGG背景文件和KEGG注释文件,如果选择其他物种,其他数据库进行分析只需要上传对应数据库的背景文件即可,格式可参照示例文件。

    (2)请注意使用说明中的3种不同的输入方法,所产生的结果不同,输入差异比较组得到的结果图及分析结果最全,其他输入方式得到的结果略少。

    (3)物种与数据库版本信息


拟南芥GCF_000001735.4_TAIR10.1
大豆GCF_000004515.5_Glycine_max_v2.1
籼稻mbkbase_R498
粳稻plantbiology_v7
酿酒酵母ASM21897v1
线虫WBcel235_2020
家蚕ASM15162v1
斑马鱼GCF_000002035.6_GRCz11
GCF_000001405.39_GRCh38.p13
GCF_000003025.6_Sscrofa11.1
GCF_002263795.1_ARS-UCD1.2
山羊GCF_001704415.1_ARS1
Oar_v1.0
兔子GCF_000003625.3_OryCun2.0
小鼠GCF_000001635.27_GRCm39
大鼠GCF_015227675.2_mRatBN7.2
小麦Ensembl_IWGSC_R45
玉米NCBI_v4
烟草GCF_001879085.1_NIATTr2


4、版本信息


版本更新时间更新内容
1.2.92020.09.01支持其他物种通过传入背景文件进行分析
1.2.102020.10.22添加Regulation可为通路图上色
1.2.112020.12.23调整基因输入格式
1.2.122021.07.20添加非GO和KEGG数据库进行富集分析的接口
1.2.132022.02.14支持人、大小鼠之外15种模式物种进行富集分析
1.1.21
2022.06.24更新报告内容并增加reactome和wikipathway的分析