<<
>>
转录组学
聚类热图
442684
查看
聚类热图(Cluster heatmap)常用于大数据表数据关系的可视化展示,以便快速阅读和发现规律。
火山图
141444
查看
火山图(Volcano Plot)是一类用来展示组间差异数据的图像,可以方便直观的展示两组样本间差异表达基因/蛋白/代谢物的分布情况。
GO-KEGG气泡图
139627
查看
本工具为绘制气泡图,用于展示富集分析结果中P值最小的前N个功能或者通路。通过气泡图,可以生动地展示富集分析结果中的各个关键统计量,从而在一张图上呈现更多的信息。 其中Y轴对应功能或者通路,X轴表示特定通路中的差异基因和通路中所有基因的比值,气泡的大小表示该通路中差异基因的多少,气泡颜色由紫-蓝-绿-红变化,其富集 pValue 值越小,显著程度越大。
富集分析
95642
查看
该工具功能包括GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)的富集分析。 GO: 其中Gene Ontology(GO)数据库提供了专业的术语来定义基因产物的属性。它包含三大类:生物学过程(Biological Process,BP)表示一个分子活动事件的过程,包括细胞、组织、器官和物种的功能集合,往往也是和实验研究问题关联程度最高的一类;细胞组分(Cellular Component,CC)表示细胞或其所处的外界环境;分子功能(Molecular Function,MF)是描述在分子水平上基因产物的活性元件。 KEGG: Kyoto Encyclopedia of Genes and Genomes (KEGG)是系统分析基因功能,联系基因组信息和功能信息的数据库。 该小工具除了支持人、大鼠和小鼠物种外还支持对含有背景文件的物种进行富集分析。
GSEA分析
59685
查看
基因集富集分析 (Gene Set Enrichment Analysis, GSEA)是一种用于确定一组预先定义的基因是否在两种生物状态(例如表型)之间显示出统计上显著的或一致的差异的计算方法。其分为三个步骤,分别为计算富集分数、估计富集分数显著性水平和矫正多重假设验证。 GESA常使用两大基因集合数据库: (1)GO:Gene Ontology(GO)数据库提供了专业的术语来定义基因产物的属性。它包含三大类:生物学过程(Biological Process,BP);细胞组分(Cellular Component,CC);分子功能(Molecular Function,MF) (2)KEGG:Kyoto Encyclopedia of Genes and Genomes (KEGG)是系统分析基因功能,联系基因组信息和功能信息的数据库。 GSEA也支持自定义基因集合,例如miRNA靶标关系对集合
差异分析
44951
查看
本工具为差异分析,旨在找出不同样本间的差异表达情况。 利用R中的DESeq或DESeq2包对各个样本的counts 数目进行标准化处理(采用BaseMean值来估算表达量),计算差异倍数,并采用NB(负二项分布检验的方式)对reads数进行差异显著性检验。 筛选标准:其一,FoldChange,即两样本中同一个基因表达水平的变化倍数;其二,pValue或qValue(adjusted pValue),qValue值的计算方法先要对每个基因进行 pValue 的计算,再用 FDR 错误控制法对 pValue 作多重假设检验校正。默认筛选差异的条件为 p<0.05 且差异倍数≥2。
GO富集条形图
43074
查看
本工具为绘制(GO或KEGG)富集基因上下调关系条形图。 Gene Ontology(GO) 数据库提供了专业的术语来定义基因产物的属性。它包含三大类:生物学过程(Biological Process, BP)表示一个分子活动事件的过程,包括细胞、组织、器官和物种的功能集合,往往也是和实验研究问题关联程度最高的一类;细胞组分(Cellular Component, CC)表示细胞或其所处的外界环境;分子功能(Molecular Function, MF)是描述在分子水平上基因产物的活性元件。
共表达相关性分析
34668
查看
根据样本一一对应关系对,计算两个组学特征之间的相关性,或一个组学特征的自相关性(即两个不同的表或者相同的表),并做热图,矩阵图和网络关系图。相关性算法可选用的有pearson相关性、spearman相关性、kendall相关性。如果不指定,默认使用pearson相关性计算方法。
组间boxplot图
30803
查看
本工具用于boxplot,适用于组别为2组及以上,组内有生物学重复的数据集。 箱线图(Box-plot)又称为箱形图,是一种用作显示一组及多组数据分布情况的统计图形。其名称来源于其形状类似于箱子。箱线图除了可以反映出一组原始数据的分布特征,还可以通过联合作图进行多组数据分布特征的比较。 箱线图的绘制方法是:先找出及计算出每组数据的最大值、最小值、上四分位数、下四分位数和中位数这五个描述分布的参数(除去离群点);然后从上四分位数和下四分位数出发延伸出两条横向线段作为上底边和下底边绘制一个矩形(形状像箱子),再从中位数出发延伸出一条横向线段将矩形分割成上下两部分;最后从上四分位数和下四分位数出发延伸出两条纵向线段至最大值和最小值。 旧版boxplot提供小提琴图的绘制 小提琴图 (Violin Plot)是用来展示多组数据的分布状态以及概率密度。这种图表结合了箱形图和密度图的特征,主要用来显示数据的分布形状。与箱形图类似,但是在密度层面展示更好。在数据量非常大不方便一个一个展示的时候小提琴图特别适用。
WGCNA
25751
查看
加权基因共表达网络(WGCNA, Weighted Gene Co-Expression Network Analysis),是一种从高通量的表达数据中挖掘模块(module)信息的算法,在该方法中module被定义为一组具有类似表达谱的基因,并探索module内基因网络与研究者关注的表型之间的关联关系。
多元统计分析
14913
查看
多元变量统计分析(Multivariate Statistical Analysis),简称多元变量分析,又称多元统计分析,为统计学的一支,常用于管理科学、社会科学和生命科学等领域。 多元统计分析将先采用无监督的主成分分析(PCA)来观察各样本之间的总体分布和整个分析过程的稳定性,然后用有监督的偏最小二乘法分析(PLS-DA)及正交偏最小二乘法分析(OPLS-DA)来区分各组间特征轮廓的总体差异,找到组间的特征差异物质。
样本相关性分析
12530
查看
根据基因表达矩阵文件,使用pearson算法计算样本之间的相关性