文献引用:Bioinformatic analysis was performed using the OECloud tools at https://cloud.oebiotech.com.
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
该工具功能包括GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)的富集分析。
GO:
其中Gene Ontology(GO)数据库提供了专业的术语来定义基因产物的属性。它包含三大类:生物学过程(Biological Process,BP)表示一个分子活动事件的过程,包括细胞、组织、器官和物种的功能集合,往往也是和实验研究问题关联程度最高的一类;细胞组分(Cellular Component,CC)表示细胞或其所处的外界环境;分子功能(Molecular Function,MF)是描述在分子水平上基因产物的活性元件。
KEGG:
Kyoto Encyclopedia of Genes and Genomes (KEGG)是系统分析基因功能,联系基因组信息和功能信息的数据库。
该小工具除了支持人、大鼠和小鼠物种外还支持对含有背景文件的物种进行富集分析。
任务正在排队中,目前后台任务排队数量:
当前任务开始运行后预计需要耗时
请勿重复提交任务!程序正在运行中,预计需要耗时
程序运行出错,报错信息如下:
玩转攻略可点击公众号推文:探“云”指南—关于富集分析的那点事
1、使用说明
1.使用方法1—— 选择物种(下拉选项中的物种示例)
(1)选择物种
选择人、小鼠、大鼠 、拟南芥、大豆、水稻、酵母、线虫、家蚕、斑马鱼、猪、牛、山羊、羊、家兔、小麦、玉米、烟草
(2)基因ID
直接输入GeneID,或在excel中复制gene_id并粘贴到文本框中。
(3)差异基因表
转录组报告中某个比较分组下的差异基因表,比如: \result\1.4different_expressed_gene\*-vs-*\*-vs-*-diff-q-val-0.05-FC-2.gene.xls
如果差异基因表的格式不为*-vs-*diff-*.xls格式,在运行的过程中可能会缺少结果,这里的文件命名格式为组1-vs组2-diff-q-val-0.05.xls.请注意这里的上下调必须为Up和Down,否则流程不识别。
gene_id | FoldChange | log2FoldChange | p-value | q-value | Regulation |
GJD2 | 110.30 | 6.7853 | 0.000002 | 0.008 | Up |
MME | 9.5045 | 3.248 | 9.49E-08 | 0.0005 | Up |
RPL3 | 0.2793 | -1.8398 | 6.84E-06 | 0.01 | Down |
demo示例文件:A-vs-D-diff-q-val-0.05-FC-2.0.gene.xls
2.使用方法2——选择物种(其他物种示例)
(1)选择物种:勾选"其他物种"
(2)GO和KEGG背景文件
第一列为基因名称,第二列为Term名称,多个以英文逗号分割,第三列为Term描述,多个以中竖线分割(|)。
GO背景文件示例:(上传背景文件中不能有标题)
gene_name | go_term | go_description |
DCUN1D1 | GO:0000151,GO:0005515 | ubiquitin ligase complex|protein binding |
MMP14 | GO:0001501,GO:0001525 | skeletal system development|angiogenesis |
PGA3 | GO:0004190,GO:0006508 | aspartic-type endopeptidase activity|proteolysis |
demo数据下载:gene_go.backgroud.xls(人)
KEGG背景文件示例:(上传背景文件中不能有标题)
gene_name | pathway | pathway_description |
MMP14 | hsa04668,hsa04912 | TNF signaling pathway|GnRH signaling pathway |
PGA3 | hsa04974 | Protein digestion and absorption |
MMP15 | hsa04928 | Parathyroid hormone synthesis, secretion and action |
demo数据下载:gene_kegg.backgroud.xls(人)
KEGG注释文件示例:(上传背景文件中不能有标题)
gene_name | gene_id | pathway |
MMP14 | 4323 | hsa04668,hsa04912,hsa04928 |
PGA3 | 643834 | hsa04974 |
MMP15 | 4324 | hsa04928 |
demo数据下载:gene_anno-kegg.backgroud.xls(人)
3.使用方法3——使用非GO和KEGG数据库进行富集分析
(1)选择物种:勾选"其他物种"
(2)"是否使用非GO和KEGG数据库进行富集分析" 项:勾选"是"
(3)富集分析背景文件:格式与GO或KEGG的背景文件一致
(4)数据库名称:结果文件中使用的名称
以wikipathway数据库为例,进行整理数据库所需的背景文件。(上传背景文件中不能有标题)
gene_name | wikipathway | wikipathway_description |
GAS6 | WP5090,WP4217,WP4806 | Complement system in neuronal development and plasticity|Ebola virus infection in host|EGFR tyrosine kinase inhibitor resistance |
GAS8 | WP4803 | Ciliopathies |
GATA1 | WP2849,WP4754 | Hematopoietic stem cell differentiation|IL-18 signaling pathway |
demo数据下载:gene_wikipathways.backgroud.xls(人)
二、结果说明
选择默认的人、大小鼠物种,最后分析结果会附带REACTOME和Wikipathway的分析结果,除此以外的其他物种没有这两类结果。如果想分析其他物种的REACTOME和Wikipathway富集分析结果,请按照选择其他物种进行分析。
目录第一层级 | 目录第二层级 | 文件 | 文件描述 |
1.GO_enrichment | enrichment_go.xls | -- | GO上调、下调、总和的注释统计 |
分组1_分组2 | *.level2.xls/png | level2水平的统计和条形图结果 | |
2.KEGG_enrichment | enrichment_kegg.xls | -- | KEGG上调、下调、总和的注释统计 |
分组1_分组2 | *.Classification.xls/png | KEGG分类图结果,包括条形图、气泡图、和弦图 | |
3.KEGG_map | 分组1_分组2 | *.html和*.png | KEGG差异基因通路图 |
4.Reactome_enrichment | -- | *.xls和*.png | REACTOME富集分析结果文件夹,包含统计表、气泡图、和弦图 |
5.WikiPathways_enrichment | -- | *.xls和*.png | Wikipathway富集分析结果文件夹,包含统计表、气泡图、和弦图 |
2.1 GO分析结果
结果示例图1 GO条形图
2.2 KEGG分析结果
结果示例图2 KEGG分类条形图和气泡图
KEGG通路图
结果示例图3 KEGG通路图
2.3 REACTOME分析结果
结果示例图4 REACTOME下调基因气泡图
2.4Wikipathway分析结果
结果示例图5 Wikipathway上调基因气泡图
3、重要提示
(1)选择物种
选择物种有18个物种可以选择,目前仅支持现有的物种进行分析,如果想要分析其他物种,如果想要分析GO和KEGG,请上传对应的GO背景文件、KEGG背景文件和KEGG注释文件,如果选择其他物种,其他数据库进行分析只需要上传对应数据库的背景文件即可,格式可参照示例文件。
(2)请注意使用说明中的3种不同的输入方法,所产生的结果不同,输入差异比较组得到的结果图及分析结果最全,其他输入方式得到的结果略少。
(3)物种与数据库版本信息
拟南芥 | GCF_000001735.4_TAIR10.1 |
大豆 | GCF_000004515.5_Glycine_max_v2.1 |
籼稻 | mbkbase_R498 |
粳稻 | plantbiology_v7 |
酿酒酵母 | ASM21897v1 |
线虫 | WBcel235_2020 |
家蚕 | ASM15162v1 |
斑马鱼 | GCF_000002035.6_GRCz11 |
人 | GCF_000001405.39_GRCh38.p13 |
猪 | GCF_000003025.6_Sscrofa11.1 |
牛 | GCF_002263795.1_ARS-UCD1.2 |
鸡 | GRCg7b_NCBI |
山羊 | GCF_001704415.1_ARS1 |
羊 | Oar_v1.0 |
兔子 | GCF_000003625.3_OryCun2.0 |
小鼠 | GCF_000001635.27_GRCm39 |
大鼠 | GCF_015227675.2_mRatBN7.2 |
小麦 | Ensembl_IWGSC_R45 |
玉米 | NCBI_v4 |
烟草 | GCF_001879085.1_NIATTr2 |
4、版本信息
版本 | 更新时间 | 更新内容 |
1.2.9 | 2020.09.01 | 支持其他物种通过传入背景文件进行分析 |
1.2.10 | 2020.10.22 | 添加Regulation可为通路图上色 |
1.2.11 | 2020.12.23 | 调整基因输入格式 |
1.2.12 | 2021.07.20 | 添加非GO和KEGG数据库进行富集分析的接口 |
1.2.13 | 2022.02.14 | 支持人、大小鼠之外15种模式物种进行富集分析 |
1.1.21 | 2022.06.24 | 更新报告内容并增加reactome和wikipathway的分析 |
1.1.50 | 2023.11.8 | 更新富集分析分类对应关系 |