<<
>>
聚类热图 326848 查看 聚类热图(Cluster heatmap)常用于大数据表数据关系的可视化展示,以便快速阅读和发现规律。 GO-KEGG气泡图 95514 查看 本工具为绘制气泡图,用于展示富集分析结果中P值最小的前N个功能或者通路。通过气泡图,可以生动地展示富集分析结果中的各个关键统计量,从而在一张图上呈现更多的信息。 其中Y轴对应功能或者通路,X轴表示特定通路中的差异基因和通路中所有基因的比值,气泡的大小表示该通路中差异基因的多少,气泡颜色由紫-蓝-绿-红变化,其富集 pValue 值越小,显著程度越大。 火山图 91112 查看 火山图(Volcano Plot)是一类用来展示组间差异数据的图像,可以方便直观的展示两组样本间差异表达基因/蛋白/代谢物的分布情况。 Venn图 70067 查看 Venn图,又称韦恩图或文氏图,是一种用于直观表示元素集合重叠的一种图形。 Venn图在生物信息学领域常用于展示样品不同分组间共有和特有的基因、OTU和分类单元等。 富集分析 63279 查看 该工具功能包括GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)的富集分析。 GO: 其中Gene Ontology(GO)数据库提供了专业的术语来定义基因产物的属性。它包含三大类:生物学过程(Biological Process,BP)表示一个分子活动事件的过程,包括细胞、组织、器官和物种的功能集合,往往也是和实验研究问题关联程度最高的一类;细胞组分(Cellular Component,CC)表示细胞或其所处的外界环境;分子功能(Molecular Function,MF)是描述在分子水平上基因产物的活性元件。 KEGG: Kyoto Encyclopedia of Genes and Genomes (KEGG)是系统分析基因功能,联系基因组信息和功能信息的数据库。 该小工具除了支持人、大鼠和小鼠物种外还支持对含有背景文件的物种进行富集分析。 PCA分析 62923 查看 主成分分析(Principal Component Analysis,PCA),是对原有的复杂数据进行降维,保持数据集中对方差贡献最大的特征,去除噪音和冗余,从而有效地找出数据中最“主要”的元素和结构,主要影响因素区分各个样本,根据样本远近展示样本/分组间的相似性和差异性。 物种累计柱状图 54273 查看 本工具为绘制累计柱状图,柱状图是一种以矩形的长度(高度)为变量的统计图表,只包含一个变量,从形式上又可以划分为累计柱状图和躲避式柱状图等不同类型。 我们以物种在样本中所占的比例作为变量,横坐标为样本,以累计柱状图的方式展现每个样本中各物种的比例。如果提供了样本分组信息,还可以通过组内求平均的方式展现每个分组的物种比例。 PCoA主坐标分析 37184 查看 PCoA(principal co-ordinates analysis)是一种研究数据相似性或差异性的可视化方法,通过一系列的特征值和特征向量进行排序后,选择主要排在前几位的特征值,PCoA 可以找到距离矩阵中最主要的坐标,结果是数据矩阵的一个旋转,它没有改变样品点之间的相互位置关系,只是改变了坐标系统。 通过PCoA 可以观察个体或群体间的差异。 GSEA分析 36580 查看 基因集富集分析 (Gene Set Enrichment Analysis, GSEA)是一种用于确定一组预先定义的基因是否在两种生物状态(例如表型)之间显示出统计上显著的或一致的差异的计算方法。其分为三个步骤,分别为计算富集分数、估计富集分数显著性水平和矫正多重假设验证。 GESA常使用两大基因集合数据库: (1)GO:Gene Ontology(GO)数据库提供了专业的术语来定义基因产物的属性。它包含三大类:生物学过程(Biological Process,BP);细胞组分(Cellular Component,CC);分子功能(Molecular Function,MF) (2)KEGG:Kyoto Encyclopedia of Genes and Genomes (KEGG)是系统分析基因功能,联系基因组信息和功能信息的数据库。 GSEA也支持自定义基因集合,例如miRNA靶标关系对集合 LEfSe分析 33707 查看 LEfSe分析即 Linear discriminant analysis Effect Size 分析,是一种用于发现和解释高维度数据生物标志物的分析工具,可以进行两个或多个分组的比较,它强调统计意义和生物相关性,能够在组与组之间寻找具有统计学差异的生物标志物(Biomarker)。 A.首先在多组样本中采用的非参数因子Kruskal-Wallis秩和检验检测不同分组间丰度差异显著的物种; B.再利用上一步中获得的显著差异物种,用成组的Wilcoxon秩和检验来进行组间差异分析; C.最后用线性判别分析(LDA)对数据进行降维和评估差异显著的物种的影响力(即 LDA score)。 差异分析 32164 查看 本工具为差异分析,旨在找出不同样本间的差异表达情况。 利用R中的DESeq或DESeq2包对各个样本的counts 数目进行标准化处理(采用BaseMean值来估算表达量),计算差异倍数,并采用NB(负二项分布检验的方式)对reads数进行差异显著性检验。 筛选标准:其一,FoldChange,即两样本中同一个基因表达水平的变化倍数;其二,pValue或qValue(adjusted pValue),qValue值的计算方法先要对每个基因进行 pValue 的计算,再用 FDR 错误控制法对 pValue 作多重假设检验校正。默认筛选差异的条件为 p<0.05 且差异倍数≥2。 GO富集条形图 31373 查看 本工具为绘制(GO或KEGG)富集基因上下调关系条形图。 Gene Ontology(GO) 数据库提供了专业的术语来定义基因产物的属性。它包含三大类:生物学过程(Biological Process, BP)表示一个分子活动事件的过程,包括细胞、组织、器官和物种的功能集合,往往也是和实验研究问题关联程度最高的一类;细胞组分(Cellular Component, CC)表示细胞或其所处的外界环境;分子功能(Molecular Function, MF)是描述在分子水平上基因产物的活性元件。
在线咨询