<<
>>
微生物组学 聚类热图 442684 查看 聚类热图(Cluster heatmap)常用于大数据表数据关系的可视化展示,以便快速阅读和发现规律。 物种累计柱状图 74874 查看 本工具为绘制累计柱状图,柱状图是一种以矩形的长度(高度)为变量的统计图表,只包含一个变量,从形式上又可以划分为累计柱状图和躲避式柱状图等不同类型。 我们以物种在样本中所占的比例作为变量,横坐标为样本,以累计柱状图的方式展现每个样本中各物种的比例。如果提供了样本分组信息,还可以通过组内求平均的方式展现每个分组的物种比例。 LEfSe分析 50920 查看 LEfSe分析即 Linear discriminant analysis Effect Size 分析,是一种用于发现和解释高维度数据生物标志物的分析工具,可以进行两个或多个分组的比较,它强调统计意义和生物相关性,能够在组与组之间寻找具有统计学差异的生物标志物(Biomarker)。 A.首先在多组样本中采用的非参数因子Kruskal-Wallis秩和检验检测不同分组间丰度差异显著的物种; B.再利用上一步中获得的显著差异物种,用成组的Wilcoxon秩和检验来进行组间差异分析; C.最后用线性判别分析(LDA)对数据进行降维和评估差异显著的物种的影响力(即 LDA score)。 PCoA主坐标分析 49627 查看 PCoA(principal co-ordinates analysis)是一种研究数据相似性或差异性的可视化方法,通过一系列的特征值和特征向量进行排序后,选择主要排在前几位的特征值,PCoA 可以找到距离矩阵中最主要的坐标,结果是数据矩阵的一个旋转,它没有改变样品点之间的相互位置关系,只是改变了坐标系统。 通过PCoA 可以观察个体或群体间的差异。 共表达相关性分析 34668 查看 根据样本一一对应关系对,计算两个组学特征之间的相关性,或一个组学特征的自相关性(即两个不同的表或者相同的表),并做热图,矩阵图和网络关系图。相关性算法可选用的有pearson相关性、spearman相关性、kendall相关性。如果不指定,默认使用pearson相关性计算方法。 组间boxplot图 30803 查看 本工具用于boxplot,适用于组别为2组及以上,组内有生物学重复的数据集。 箱线图(Box-plot)又称为箱形图,是一种用作显示一组及多组数据分布情况的统计图形。其名称来源于其形状类似于箱子。箱线图除了可以反映出一组原始数据的分布特征,还可以通过联合作图进行多组数据分布特征的比较。 箱线图的绘制方法是:先找出及计算出每组数据的最大值、最小值、上四分位数、下四分位数和中位数这五个描述分布的参数(除去离群点);然后从上四分位数和下四分位数出发延伸出两条横向线段作为上底边和下底边绘制一个矩形(形状像箱子),再从中位数出发延伸出一条横向线段将矩形分割成上下两部分;最后从上四分位数和下四分位数出发延伸出两条纵向线段至最大值和最小值。 旧版boxplot提供小提琴图的绘制 小提琴图 (Violin Plot)是用来展示多组数据的分布状态以及概率密度。这种图表结合了箱形图和密度图的特征,主要用来显示数据的分布形状。与箱形图类似,但是在密度层面展示更好。在数据量非常大不方便一个一个展示的时候小提琴图特别适用。 CCA-RDA分析 17422 查看 RDA/CCA 为基于对应分析发展的一种排序方法,将对应分析与多元回归分析相结合,每一步计算均与环境因子进行回归,又称多元直接梯度分析,主要用来反映菌群与环境因子之间的关系。 RDA 是基于线性模型,CCA 是基于单峰模型。分析可以检测环境因子、样品、菌群三者之间的关系或者两两之间的关系。 样本相关性分析 12530 查看 根据基因表达矩阵文件,使用pearson算法计算样本之间的相关性 相关性热图交互 9039 查看 相关性热图常用于算两个组学特征之间的相关性,或一个组学特征的自相关性(即两个不同的表或者相同的表),并作热图。相关性算法可选用的有pearson、spearman、kendall。 NMDS分析 8429 查看 NMDS(Nonmetric Multidimensional Scaling)分析又称为非度量多维尺度分析,它是一种非约束排序分析,可将多维空间的研究对象(样本或变量)简化到低维空间进行定位、分析和归类,同时又保留对象原始关系的数据分析方法。它侧重于反映距离矩阵中数值的排序关系,弱化数值的绝对差异程度,在多样本且物种数量比较多的情况下,NMDS能更加准确的反映出距离矩阵的数值排序信息。 随机森林 8255 查看 随机森林是一种机器学习算法,最早由 Leo Breiman 和 Adele Cutler 提出,该算法能够对微生物群落样本进行有效且准确的分类,并且可以找出能够区分组间差异的关键成分(OTU或物种)。 简单的说,随机森林就是用随机的方式建立一个森林,森林里面有很多的决策树,并且每棵树之间是没有关联的。得到一个森林后,当有一个新的样本输入,森林中的每一棵决策树会分别进行一下判断,进行类别归类(针对分类算法),最后比较一下被判定哪一类最多,就预测该样本为哪一类。 QIIME2常规流程(ASV) 6987 查看 微生物QIIME2常规分析流程(ASV),在常规报告基础上实现剔除样本、增加分组分析和修改样本分析名。 请参考使用说明核对文件格式要求。 请注意:如果您的项目报告中有一键化分析的按钮,可执行一键化分析,与此工具是一样的。链接如下:https://cloud.oebiotech.com/#/user/reportlog
在线咨询